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Partea I 


NOTIUNI GENERALE 

■ % ~ 




OBIECTUL INFORMATICII MEDICALE 


Informatica medicala este o discipline tanara, termenul aparand in cursul anilor 
’60. in aceptiunea initiala informatica medicala cuprindea programele de calculator cu 
aplicabilitate in domeniul medical. Progresul tehnic rapid a aratat insa ca, pentru 
acelea§i aplicatii, atat programele cat §i suportul fizic se schimbau; ceea ce ramanea la 
fel era modul in care era prelucrata informatia. 

Astfel, in acceptiunea actuala, centrul defmitiei s-a mutat de la „calculator” la 
informatie. Coiera [1997] chiar atrage atentia in acest sens: „Informatica medicala se 
ocupa de calculatoare tot atat de mult cat se ocupa cardiologia de stetoscoape”. 

Definitii: Obiectul informaticii medicale - caseta 1.1. 


Teoria informatiei 

Notiunea de informatie 

Pentru a ne ocupa de informatia medicaid , sa incercam mai intai sa privim 
conceptul de informatie la modul general. 

Termenul de informatie este folosit in mod curent in viata de zi cu zi, fiind cel 
mai adesea asociat cu aducerea unui element de noutate. Fiind un concept cu grad inalt 
de generalitate (categorie filosofica), informatia nu poate fi defmita in maniera clasica, 
pomind de la genul proxim §i precizand diferentele specifice, ci prin propietatea sa 
esentiala - cea de a inlatura o nedeterminare. 

Notiunea de informatie - caseta 1.2. 

Proprietatile informatiei 

Informatia nu este materiel totu§i ea nu poate exista inafara materiei. Norbert 
Wiener spunea “Creierul nu secreta informatie precum ficatul fiere”. 

Informatia nu este energie; totu§i ea nu se poate transmite fara un suport 
energetic. 

Nu este o relatie directa intre cantitatea de energie ce insote§te transmiterea unei 
informatii §i cantitatea de informatie transmisa. De exemplu, energia unui trasnet in 
timpul unei furtuni este imensa, insa informatia transmisa este neglijabila; in schimb un 
fo§net intr-o padure, purtat de o energie infima poate reprezenta o informatie vitala - 
punand pe fuga un animal! Sa semnalam totu§i ca nu exista relatie nici intre cantitatea 
de informatie §i efectele sale. De ex. Legenda lui Tezeu din metodologia greaca: Tezeu 
promisese tatalui sau Aegeus, ca daca va invinge in lupta minotaurul va inlocui panza 
neagra a corabiei cu panza alba, dar a uitat §i tatal sau s-a aruncat de pe stand. 
Informatia primita a fost doar 1 bit. 

Triada aborddrilor complete 

Introducerea aspectelor informational in studiul materiei vii completeaza 
imaginea noastra privind complexitatea sistemelor biologice, actualmente considerandu- 
se ca o abordare completa trebuie sa acopere atat aspectele materiale §i energetice cat §i 
cele informationale. 

Triada abordarilor complete - caseta 1.3. 
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Valoarea utild a informatiei 

Sensul notiunii de informatie, a§a cum a fost prezentat mai sus etc. legat de alta 
notiune - nederminarea (sau incertitudinea) - vag defmita la randul sau. Acela§i mesaj 
poate sa aiba valori informationale diferite pentru diferiti receptori: pentru o persoana 
care deja §tia continutul sau cantitatea de informatie primita este zero, insa pentru 
receptorii care nu-i §tiau continutul va putea fi evaluata cantitatea de informatie primita 
deci: 

Valoarea utild a informatiei depinde de receptor. 


Caseta 1.1 

Obiectul informaticii medicale 

Acceppunea clasica: totalitatea programelor de calculator cu aplica|ii m domeniul 
biomedical §i sanatate. 

Definipa actuala: disciplina care studiaza intregul flux al informatiei medicale: 
generare, achizifle, stocare, transmitere, prelucrare §i utilizare. 

Caseta 1.1a 

Structura cursului de informatica medicala 
Partea I - Nivel individual 
SecpuneaA. Date 

1 . Stocare: Baze de date medicale 

2. Prelucrare 

2a: Date calitative §i numerice: Biostatistica 
2b: Date grafice: Semnale biologice 
2c: Imaginf. Imagistica medicala 
Secpunea B. Cuno§tin{e 

3. Decizia medicala asistata de calculator 
Partea II - Nivel supraindividual 

4. Sisteme informatice in sanatate 

Caseta 1.2 

No|iunea de informatie 

Informatia este un concept cu grad inalt de generalitate caracterizat prin proprietatea 
de a Tnlatura o nedeterminare (incertitudine). 


12 








Caseta 1.3 

Triada abordarilor complete 

aspectul material - structura 
aspectul energetic - suportul functional 
aspectul informational - mecanismul functional 
Valoarea utila a informatiei depinde de receptor 

Caseta 1.4 

Cantitatea de informatie 

Cantitatea de informatie eliberata de un eveniment a carui probabilitate 
este pi 

h=~ lo g 2 Pi l 1 ) 

Unitatea de masura pentru cantitatea de informatie = bit 
Definite: Un bit este cantitatea de informatie primita cand se tnlatura o 
nedeterminare de 1/2 

Pentru o succesiune de N evenimente (mesaj de lungime N) 

/ = !>,/, ( 2 ) 

i = 1 

Entropia informational este cantitatea medie de informatie per eveniment 
(simbol) Tntr-un mesaj: 

k 

ff=-5>k*2Pl (3) 

i = 1 

Caseta 1.5 

Redondan|a 

Entropia maxima: pentru evenimente echiprobabile pi = 1 / k, de unde 

Hmax = IOQ2 k ( 1 ) 

Redondanta absoluta: 

R = Hmax~ Hreal ( 2 ) 

Redondanta relativa: 

R r =R/H max (3) 
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Cantitatea de informatie 


Parcurgerea acestui subiect necesita cuno^tinte fundamentale de teoria 
probabilitatilor 

Pornind de la proprietatea fundamental^ a informatiei, cea de a inlatura o 
nedeterminare, Shannon a considerat ca informatia primita este invers proportionala cu 
probabilitatea de aparitie a evenimentului: daca se va intampla un eveniment cu 
probabilitate mare, informatia primita este mica; in schimb primim o informatie “mai 
mare” daca apare un eveniment mai rar. (Ziari§tii exploateaza intens aceasta relatie!) 

Relatia propusa de Shannon pentru calculul cantitatii de informatie care este 
primita cand se petrece un eveniment cu probabilitatea pi cuprinde logaritmul in baza 2 
din inversul probabilitatii pi (formula (1) in caseta 1.4). 

Pe baza acestei relatii stabileste unitatea de masura pentru cantitatea de 
informatie, numita bit (de la Binary digiT). 

in mod usual informatia se transmite printr-o succesiune de evenimente, numita 
adesea mesaj , iar un eveniment intr-un mesaj se mai nume§te simbol. 

In cazul unui mesaj format din N evenimente, fiecare eveniment i apare de n t ori, 
aducand de fiecare data informatia I i? deci mesajul aduce informatia 

k 

I = n x I x + r/ 2 I 2 + ... + n k I k = ^ n i I i relatie care este trecuta §i in caseta 1.2. 

i = 1 

Valoarea medie a informatiei corespunzatoare unui eveniment intr-un §ir de N 
evenimente se mai nume§te “entropie informationala, H, §i se calculeaza astfel: 


H = 


U \I\ +fl 2^2 + -- + n kh 
N 


n \ T n 2 T n k T 

= — / 1 +.»+—/* 

N N N 


la limita (i.e. atunci cand N — > oo) relatia devine: 

k 

H = pJi + ... + p k I k 

i = 1 

inlocuind /, conform relatiei (1), obtinem formula (3) din caseta 1.4, formula 
fundamentals in teroria informatiei, numita §i formula lui Shannon pentru entropia 
informationala. 


Relatia intre entropia informationala §i entropia termodinamica 

Termenul de “entropie” a fost introdus in termodinamica pentru enuntarea 
principiului al II-lea al termodinamicii: “in procesele termodinamice entropia nu poate 
sa scada: ea ramane constants in cadrul proceselor reversibile §i create in cazul 
proceselor ireversibile”. 

Relatia intre entropia termodinamica §i cea informationala poate fi inteleasa 
pornind de la experimentul “ideal” propus de Maxwell pentru explicarea variatiei 
entropiei in cazul proceselor ireversibile, prezentat in cadrul cursului de biofizica. 

Se vede deci ca sistemul poate evolua in sens contrar celui dictat de al II-lea 
principiu al termodinamicii in cazul in care prime§te o informatie. Acesta este 
mecanismul prin care sistemele vii evolueaza spre stari tot mai organizate §i deosebite 
de mediul inconjurator. 

Redondanta 

Entropia informationala are valoare maxima cand evenimentele din mesaj sunt 

echiprobabile: p. = — ; 

k 
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atunci H = k 


— log— I de unde se obtine relatia (1) din caseta 1.5. 

k k 


Un exemplu ar fi cazul unui mesaj encriptat, in care probabilitatea aparitiei unui 
simbol este (cel putin aparent) independent*! de simbolurile anterioare. in mesaj ele reale 
probabilitatea unui simbol depinde de simbolurile anterioare; putem, in functie de 
context, sa “ghicim” ce urmeaza, putem folosi prescurtari, putem observa gre§eli cum ar 
fi omisiunea unei litere etc. Deci informatia nu este distribuita uniform in mesaj sau 
chiar in interiorul cuvintelor, cantitatea de informatie transportata in realitate fiind 
inferioara celei maxime ce ar putea fi transmise folosind aceea§i lungime a textului. 
Aceasta diferenta, intre cantitatea maxima ce poate fi continuta in mesaj §i cea reala se 
nume§te redondanta §i reprezinta o parte din mesaj care. . . nu contine informatie! 

Relatia de defmitie a redondantei absolute este: 


R = H m 


H i 


real 


Raportand redondanta absoluta la H m 
caseta 1.5). 


se define§te redondanta relativa (vezi 


Rolul redondantei 

Aparent redondanta ar reprezenta o incarcatura inutila in mesaj. Totu§i, prezenta 
ei diminueaza rolul negativ al perturbatiilor ce apar in cursul transmiterii informatiei, 
putand deseori reconstitui mesaj ul initial chiar daca unele simboluri au fost perturbate. 


Transmiterea informatiei 

Am precizat anterior ca valoarea utila a informatiei depinde de receptor, deci 
notiunea de informatie are sens doar daca se transmite; altfel, ramane in faza de 
“informatie potentiala”. 

Transmiterea informatiei presupune o sursa a informatiei (emitator E) §i un 
destinatar (receptor R). Spatiul dintre S §i R reprezinta canalul de comunicatie (C). Pe 
canalul de comunicatie pot sa apara diverse zgomote care perturba sistemul de 
comunicatie afectand calitatea transmisiei. 

Sa introducem doi termeni important in cadrul sistemelor de comunicatie: 
mesaj - un termen pe care il folosim cand ne referim la continutul 
informational al transmisiei 

semnal - suportul fizic care transporta mesajul (sunet, current electric etc.). 

Pentru diminuarea efectelor perturbatiilor sau pentru a asigura transmiterea 
mesaj ului la distante foarte mari, se introduc pe canalul de transmisie ni§te dispozitive 
numite traductori. Un traductor schimba suportul fizic al unui semnal. De exemplu, in 
cazul unei convorbiri telefonice, microfonul este traductorul localizat langa emitator, 
transformand sunetele (variatii ale presiunii aerului) in variatii ale unui curent electric. 
Canalul de comunicatie este reprezentat de firele telefonice. La destinatar un alt 
traductor, casca telefonica, transforma variatiile curentului electric in vibratii ale unei 
membrane elastice generand astfel sunete. 

Exista §i alte dispozitive ce pot fi utilizate in sisteme de comunicatie, de ex. 
modem-ul. Denumirea modem provine de la modulator/demolator. Modemul este un 
dispozitiv care asigura modularea semnalului, adica suprapunerea semnalului real peste 
un semnal purtator (unda purtatoare) care are caracteristici incat se diminueaza efectul 
perturbatiilor (de ex. perturbatiile uzuale, de joasa frecventa, sunt eliminate daca unda 
purtatoare are frecventa inalta). 

O alta transformare pe care o putem aplica semnalului pentru transmisie este 
codificarea. Mesajul este compus uzual dintr-o succesiune de simboluri. Totalitatea 
simbolurilor utilizate pentru a compune un mesaj se nume§te alfabet. Simbolurile 
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alfabetului se mai numesc “ litere ”, iar cu literele putem construi cuvinte. Totalitatea 
cuvintelor cu sens reprezintS un dictionar , iar precizarea sensului cuvintelor se nume§te 
semantica. Cu ajutorul cuvintelor se pot construi propozitii; regulile de constructie a 
propozitiilor se nume§te sintaxa. Un dictionar impreunS cu semantica §i o sintezS 
reprezinta un limbaj. Noi folosim uzual pentru comunicatie limbaje naturale , dar exists 
posibilitatea utilizSrii unor limbaje formale sau artificiale. Diferitele componente ale 
sistemului de comunicatie pot folosi diferite alfabete sau dictionare. Transpunerea unui 
mesaj dintr-o forma ce utilizeazS un alfabet intr-o forma in alt alfabet, cu anumite reguli 
de corespondents se nume§te codificare. Operatiunea inversS se nume§te decodificare. 
Transpunerea unui mesaj dintr-un limbaj in altul se nume§te traducere. 

SS mai mentionSm legat de sistemele de comunicatie cS exista o capacitate 
limitatS de transmisie a informatiei pe canalul de comunicatie, numitS viteza de 
transmisie , mSsuratS in bit/secundS. 

Exemple de transmisie a informatiei in materie vie 

a) Codul genetic. Informatia privind structura proteinelor ce pot fi sintetizate este 
stocatS in molecula de AND din nucleu. Acizii nucleici contin 4 baze azotate: 
adenina A, timina T, citozina C §i guanina G (in cazul ARN in loc de timinS apare 
uracilul u). Proteinele sunt formate din 20 de aminoacizi esentiali. O succesiune de 
3 baze azotate din AND se nume§te codon §i poartS informatia pentru codificarea 
unui aminoacid intr-o secventS proteicS. Totalitatea corespondentilor intre codoni §i 
aminoacizii corespunzStori poarta denumirea de cod genetic. Portiunea dintr-un 
lant AND care poarta informatia pentru sinteza unei proteine se nume§te gena , iar 
ansamblul tuturor genelor unei specii se nume§te genom. Genomul uman contine 
circa 30.000 gene. 

Exercitiu: Ce cantitate medie de informatie poarta un aminoacid intr-o structura 
proteica avand 1 00 aminoacizi? 

Rezolvare: Consider dm ca cei 20 aminoacizi au aceea§i probabilitate de aparitie intr-o 
secventa proteica (ipoteza relativ departata de realitate, dar simplificatoare pentru 
rezolvarea problemei). Calculam entropia informationala cu relatia (3) din caseta 1.4 
inlocuind p t = 1/20, deci: 

20 

H = -]T (1 / 20) log 2 </ 20 y — • log 2 20 « 5 • 4,2 = 21 bin 
1 20 

b) Codificarea informatiei in sistemul nervos. Pe axoni informatia este transmisa 
printr-o succesiune de impulsuri nervoase; fiecare impuls nervos este un potential 
de actiune care are intotdeauna aceea§i amplitudine. Unui stimul mai intens ii 
corespunde o rata mai ridicata de formare a potentialelor de actiune; spunem ca pe 
axon informatia privind intensitatea stimulului este codificata in frecventa. 

La nivelul sinapselor are loc o descarcare a veziculelor cu mediator chimic in 
spatiul sinaptic, cantitatea de mediator descarcata fiind proportionals cu frecventa 
impulsurilor nervoase pe axon; spunem cS in spatiul sinaptic informatia privind 
intensitatea stimulului este codificata in amplitudine , aceasta fiind reprezentatS de 
cantitatea de mediator descSrcatS. 

La nivelul membranei postsinaptice, mediatorul se cupleazS pe receptorii 
postsinaptici, se deschid canalele de sodium, membrana se depolarizeazS §i apare 
un potential care se propagS pe membrana corpului neuronal sau pe dendrite. 
Spunem cS informatia este codificata in amplitudine , aceasta fiind reprezentatS de 
potentialul local. 
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Informatica medicala 

Dupa aceasta incursiune in teoria informatiei putem reveni la notiunea centrala 
din informatica medicala §i anume informatia medicaid. 

Ce este informatia medicala §i cand apare ea? 

Date §i cuno§tinte 

Sa incercam sa schitam in cel mai simplificat mod actul medical primar §i anume 
vizita pacientului la medic. Pozitia centrala in activitate medicala este ocupata de 
pacient. Fara pacient nu exista medicinal Actorul principal al activitatii medicale este 
medicul, dar in activitatea medicala sunt implicate numeroase alte persoane care apartin 
a§a-numitelor “profesii aliate ”. Dialogul medic-pacient incepe uzual cu expunerea de 
catre pacient a motivelor pentru care s-a prezentat la medic. Aceasta descriere 
reprezinta transmiterea unor informatii de la pacient catre medic. Informatiile care se 
transmit sau se utilizeaza intr-un act medical (sau ca urmare a unui act medical) 
reprezinta informatia medicaid. Dialogul este succedat de catre examenul obiectiv al 
pacientului, medicul colectand astfel §i alte informatii despre pacient. Sa observam ca 
aceste informatii au un caracter individual - sunt valabile pentru acest pacient. Aceste 
informatii se numesc date. Uzual paleta datelor se completeaza cu informatii provenind 
§i din alte investigate (probe de laborator, explorari functionale, radiografii etc.). 
Indiferent cat de complexe ar fi ca reprezentare, ele sunt “date”, fiind caracteristice unui 
anumit individ. 

in acela§i timp, medicul utilizeaza §i alt fel de informatii, numite cuno§tinte. 
Acestea au un caracter general §i sunt acumulate in cursul pregatirii profesionale 
precum §i in experienta sa practica. Fara aceste cuno§tinte informatiile sub forma de 
date nu pot fi interpretate (revenim la afirmatia ca valoarea utila a informatiei depinde 
de receptor; practic, fara aceste cuno§tinte receptorul datelor nu este “medic”). De aceea 
numero§i autori numesc informatie doar datele interpretate. Pentru a evita confuzia 
intre termenul informatie folosit la modul general §i informatie pentru treapta de date 
interpretate , vom pastra termenul de date interpretate pentru acest nivel. 

Ciclul elementar al informatiei medicale 

Prin interpretarea datelor de catre medic pe baza cuno§tintelor sale, este generata 
o noua informatie numita diagnostic. Pe baza diagnosticului, folosind din nou 
cuno§tintele sale, medicul stabile§te un plan terapeutic pe care il aplica pacientului cu 
scopul de a imbunatatii starea pacientului. Urmarirea evolutiei pacientului este insotita 
de colectarea unor noi informatii sub forma de date. Se observa ca se inchide un ciclu al 
fluxului informational in activitatea medicala, numit “ciclul elementar al informatiei 
medicale”. 

Tipuri de date 

Informatiile culese despre starea pacientului, adica datele, pot imbraca diverse 

forme: 

date calitative - cu caracter descriptiv, a§a cum apar in anamneza 
date numerice - forma uzuala de prezentare a rezultatelor de laborator 
grafice - modul de inregistrare a evolutiei in timp a unor marimi biologice 
(ex.: semnalul ECG, EEG etc.) 

sunete - de ex. fonocardiograma; modul de prelucrare este asemanator cu cel al 
altor semnale 

imagini - radiografia, tomografia, ecografia etc. 
imagini dinamice - filme. 
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Modul de achizitie, stocare §i prelucrare este specific pentru fiecare tip de date §i 
in cadrul cursului nostru le corespund capitole separate. 

Tipuri de cuno §tinte 

Cuno§tintele pot fi de mai multe feluri: 

cuno§tinte explicite - care se pot formaliza, se pot exprima in propozitii, pot fi 
u§or transmise pe cale orala sau scrisa 

abilitati sau cunogtinte tacite (limba engleza - skill ) - cele castigate prin 
experienta practica (de ex. indemanarea unui chirurg sau a unui dentist); nu pot 
fi transmise u§or. 

Clasificarea informatiei medicale pe nivele structural 

in ciclul elementar al informatiei medicale prezentat mai sus am luat in 
considerare informative care apar in activitatea medicala curenta, la nivelul individului, 
numit pacient. Totu§i fenomenele care se petrec in materia vie (legate de starea de 
sanatate a pacientului) privesc deseori nivele infraindividuale, pornind de la nivelul 
molecular sau celular, urcand prin nivelul de tesut, organ sau sistem pana la nivelul 
intregului organism sau nivelul individual. 

Pe de alta parte, activitatea medicala este organizata in unitati care presteaza 
servicii pentru populatie, deci putem urmari fluxul informational §i la nivel 
supraindividual, de comunitate. Corespunzator acestor nivele structural avem diferite 
discipline biomedicale precum §i diferite capitole corespunzatoare ale informaticii 
medicale. 

Operatii cu informatii 

Urmarind ciclul de viata al informatiei, din momentul generarii sale pana in 
momentul utilizarii, observam ca informatia sufera o serie de operatii: 

achizitia (colectarea) - presupune mijloace specifice tipului de informatie 
stocarea - baze de date, respective baze de cuno§tinte 
transmitere - cai, procedee 

prelucrare - cu o larga paleta de metode specifice, pentru a extrage elementele 
esentiale in vederea interpretarii §i utilizarii 

protectie - masurile ce se impun pentru asigurarea integritatii informatiei 
stocate sau transmise, precum §i a confidentialitatii acesteia 
interpretare/utilizare - pasul final, in care informatia este integrate in actiunile 
specifice nivelului. 

Capitolele informaticii medicale §i structura cursului 

Structura schematica a cursului cu durata de un semestru (predat in anul I la 
studentii facultatii de medicina) este prezentata in caseta 1.1a. Partea referitoare la 
cuno§tintele medicale este prezentata sumar, la nivel introductiv. 

Notiunile de modelare, bioinformatica §i neuroinformatica se predau numai sub 
forma de cursuri avansate §i nu sunt cuprinse in acest volum. 
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BAZE DE DATE MEDICALE. NOTIUNI INTRODUCTIVE 



Ce sunt bazele de date ? 


Sunteti mult mai familiarizati cu acest concept decat crede|i. Tntalniy baze de date in 
viata de fiecare zi. A{i rasfoit vreodata un program TV? A{i consultat un dictfonar sau 
o enciclopedie? Aj;i intrat intr-o biblioteca? Ei, toate astea sunt baze de date. 


O baza de date este o colectie organizata de date. O baza de date de calculator va 
fi o colectie de date organizata in calculator (mai exact, in fi§iere). Ce fel de date? Orice 
fel: liste cu nume §i adrese, cartile dintr-o biblioteca, orice doriti sa organizati §i sa 
pastrati. 

1. FI§IERE DE DATE 


DEFINIJII 

Fi§ier (file) = o colectie organizata de date 

Date (data) = reprezentari formalizate sau fapte (“instante”), adecvate prelucrarilor 
umane sau automate 



Ce nevoie am de “fi§iere de date”? Nu pot mregistra orice informal}! intr-un 
fi§iercreat cu un editor de texte, de exmplu cu Word?! 


NU! Categoric nu. 

Un editor de text creaza fi§iere de tip text §i ne ofera facilitati de redactare §i aranjare 
a textului destinat afi§arii §i/sau tiparirii. 

In fi§ierele de date informatia este organizata dupa o schema : anumite structuri sau 
machete precizate de noi, astfel meat sa regasim u§or orice informatie odata mscrisa 
in baza de date §i sa o putem prelucra dupa dorinta. 


Un fl§ier de date in format electronic (“pe calculator”) nu va fi o structura rigida 
ca o carte de telefon sau un mers al trenurilor tiparite pe hartie. El ne ofera o structura 
flexibila prin faptul ca putem cauta datele dupa diverse criterii §i le putem chiar 
modifica ordinea. Putem lua ca exemplu fi§ierul de date reprezentat de catalogul cu fi§e 
dintr-o biblioteca, care are un anumit format fix. Deoarece fiecare carte este afi§ata prin 
titlul ei sau prin autor, pentru a gasi o anumita carte din acel catalog, trebuie sa 
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cunoa§tem titlul sau autorul. Daca nu ne putem aminti cu suficienta precizie nici una din 
aceste informatii, rezultatul va fi o cautare intortocheata prin toate fi§ele catalogului. 
Daca acest catalog ar fi fost un fi§ier de date “pe calculator”, am fi putut cauta nu numai 
dupa nume sau autor, ci §i dupa diverse cuvinte-cheie, dupa data publicarii, sau dupa 
franturile de informatie despre autor pe care ni le amintim. 


Un lucru foarte important este SCHEMA sau STRUCTURA UNUI FISIER DE DATE: 


Element de 
structura 

Nume in lb. 
engleza 

Explicate, exemplu 

inregistare 

record 

similarul unei fi§e clasice 
(fi§a de carte la biblioteca) 

camp 

field 

similarul unei rubrici din fi§a clasica 

(“numele §i prenumele”, “sex”, “data na§terii”, etc.) 

articol 

item 

continutul concret al unui camp, respectiv al unei 
rubrici (“POPESCU ALEXANDRU” atunci cand 
reprezinta continutul campului numele §i 
prenumele) 


Daca ne propunem sa tinem evidenta pacientilor folosind un calculator, vom 
inscrie datele care erau continute in fi§a de evidenta clasica (pe hartie) in inregistrari 
continute in fi§iere de date, a§a cum ne propun figurile 1.1 si 1.2. 


Spitalul Clinic Judetean Timi$ 

Olinica Chirurgie II 

FI§A DE EVIDENTA 

1. Nr. registru I I I I I 

2. Nume, prenurne l l l l l l l l l l l l l l l l l l l l l l l l 


3. Sex (M/F) □ 

4. Data nasterii (zz-ll-aa) l l l l l l l 

5. Ocupatie (coduri - anexal) i i i i i i i i i i i i 

6. Diagnostic la intemare (cod OMS) i i i i i i i i i i i i i 

7. Greutatea (kg) | | | | | 



Figura 1.2. Organizarea unui fi§ier de date secvential 
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Ne putem imagina fi§ierul de date ca fiind un dosar cu inregistrari (fi§e de 
evidenta, in acceptiunea clasica). Observati ca fiecarui pacient ii va corespunde o 
inregistrare (o fi§a de evidenta) - record. Fiecare inregistrare este formata din campuri 
(rubricile ce trebuiau completate la o fi§a clasica) - fields. Fiecare camp are un nume §i 
o dimensiune (exista rubrici mai “incapatoare”, ca cele pentru nume, diagnostic §i unele 
mai “inguste”, ca cele pentru sex sau greutate). 

Datele concrete care se introduc la un moment dat intr-un anume camp le vom 
numi articole - items (ca de exemplu, POPESCU pentru nume, sau M pentru sex, etc.). 


Fiecare camp se va caracteriza prin cateva proprietati: 


Proprietate camp 

Exemplu 

nume camp 

“Nume”, “Data na§terii”, “Sex”, etc. 

tip camp 

numeric (intreg, real), caracter, logic, data 
calendaristica, etc. 

dimensiune camp 

50 caractere, numar real cu 3 cifre la partea intreaga §i 2 
cifre la cea zecimala, etc. 


Toate aceste elemente de structura trebuiesc definite la crearea fi§ierului de date. 


Putem deci vedea fi§ierele de date ca ni§te tabele pe care le defmim atunci cand 
precizam structura §i le “umplem” apoi cu datele propriu-zise (cu articole sau items 
concrete) - figura 1.3. 


Nr. 

reg. 

Nume 

Sex 

Data_na§t. 

Ocupatie 

Diagnostic 

Greutatea 

2345 

Ionescu Adrian 

M 









































Figura 1.3. Organizarea logica a unui fi§ier de date sub forma unui table 


2. BAZEDEDATE 

O baza de date este formata din unui sau mai multe fisiere de date, dar este mai 
mult decat o simpla colectie de fisiere: include, pe langa acestea, descrierea relatiilor 
dintre inregistrari, descriere apelata $i utilizata pe toata durata prelucrarii informatiilor. 
Figura 1.4 prezinta comparativ organizarea informatiei sub forma unei baze de date la 
nivel institutional versus o colectie de fisiere independente, corespunzatoare diferitelor 
departamente dintr-o institute. 

DEFINITE 

Baza de date (database) = o inregistrare structurata de date: confine atat datele, cat 
§i schema acestora, adica mijloacele de a stabili §i a meniine relatii Tntre date; aceste 
relatii trebuie sa reflecte relatiile dintre entitatile reale descrise de date (obiecte fizice, 
evenimente, concepte abstracte) 
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Inregistrari 

Inregistrari 

Inregistrari 

Inregistrari 

Inregistrari 

pacienti 

i 

salarii 

angajati 

de inventar 

t 

pacienti 

T 

Clinica 

Departament 

Departament 

Departament 

Clinica 

medicala 

salarii 

personal 

aprovizionare 

chirurgie 


Clinica 

medicala 

Clinica 

^ chirurgie 


Baza de date 


integrata 

Departament * 

Departament 

salarii 

T aprovizionare 


Departament 

personal 

(b) 


Figura 1.4. Organizarea informatiei intr-o baza de date la nivel institutional (b) comparat cu 
existenta unor fi§iere de date independente (a) [Brookshear 2007] 


La culegerea datelor trebuie neaparat sa fie deja stability structura fi$ierelor §i 
criteriile de validare, care trebuie sa tina seama de alcatuirea fi§ei de evidenta clasice 
(cu cat discrepantele de organizare sunt mai substantial, cu atat mai mari vor fi §ansele 
de eroare la introducerea datelor §i retinerea personalului in adoptarea evidentei 
electronice a informatiei). Pentru compactarea datelor din fi§iere se pot folosi codificari. 



Am auzit de “validarea datelor”. Ce mseamna asta? 


Validarea datelor la introducerea lor in baza de date o putem vedea pe mai multe nivele. 
Exista o validare primara, care se face implicit prin modul in care a fost precizata 
structura: nu voi putea introduce caractere alfabetice intr-un camp numeric, a§a cum, 
daca voi introduce cifre intr-un camp de tip caracter, ele nu vor avea nici un fel de 
semnificajie valorica (nu voi putea face opera(ii matematice cu ele). Pe al doilea nivel de 
validare exista posibilitatea precizarii unor anumite valori sau intervale de valori pe care le 
pot lua articolele din campuri: de exemplu, “M” §i “F” pentru campul sex, valori pozitive §i 
mai mici decat 2.5 pentru campul maltime, etc. Poate exista §i un al treilea nivel de 
validare, in care se iau in considerare criterii mai complexe, care sa (ina cont de 
eventualele relatii intre campuri §i inregistrari. 


Dezvoltarea schemei unei baze de date se face in etapa de proiectare sau de 
design a acesteia. Odata definita schema sau structura bazei de date, utilizatorul nu va 
mai fi preocupat de chestiuni legate de organizarea fizica a datelor in fi§ierele care 
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compun baza de date. De asta se vor ocupa programe speciale. Utilizatorul va face 
referire la date prin numele campurilor §i astfel programele scrise pentru consultarea §i 
administrarea bazelor de date vor fi independente de configura§ia fizica. 


3. SISTEME DE GESTIUNE A BAZELOR DE DATE 


DEFINITE 

Sistem de Gestiune a Bazelor de Date - SGBD ( DBMS - DataBase Management 
System) = un set de “unelte software ” corelate ce au ca scop “constructia” unei baze 
de date §i apoi accesul la aceasta; in plus, ele controleaza securitatea, integritatea §i 
secretul datelor 


Aceste instrumente software incorporeaza suplimentar: limbaje specializate 
pentru descrierea §i manipularea datelor; (eventual) un sistem de dictionare de date. 
Accesul §i manipularea datelor se poate face direct prin functiile oferite de SGBD. Cel 
mai adesea insa, acest lucru il fac utilizatorii specializati. Utilizatorul obi§nuit va utiliza 
baza de date la nivelul aplicatiilor specifice scopului dorit, prin intermediul unor 
interfete speciale definite pentru conectarea programelor de aplicatie la DBMS (API - 
Application Programming Interface). Figura 1.5 prezinta acest concept de acces pe mai 
multe niveluri la baza de date propriu-zisa. 









Utilizator ► 

Software . 

de aplicatie 

— SGBD ► ■ 

Baza de date 

propriu-zisa 









Datele vazute Datele vazute Datele vazute 

in termenii aplicatiei in termenii modelului in organizarea 

bazei de date lor propriu-zisa 

Figura 1.5. Conceptul de stratificare a accesului la baza de date: pozitia utilizatorului fata de 
baza de date [Brookshear 2007] 

Un SGBD are trei functii de baza: 

■ functia de descriere 

■ functia de manipulare 

■ functia de utilizare. 

FUNCTIA DE DESCRIERE 

Functia de descriere permite descrierea schemei bazei de date (structura datelor §i 
relatiile dintre acestea). Totodata, se defmesc §i conditiile de acces la informatiile 
continute in baza de date. Descrierea schemei se realizeaza cu ajutorul unui limbaj de 
descriere propriu fiecarui sistem de gestiune. 
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FUNCTIA DE MANIPULARE 

Functia de manipulare permite efectuarea urmatoarelor operatii: crearea, inserarea, 
suprimarea sau actualizarea unor inregistrari definite de utilizator; faciliteaza cautarea, 
sortarea §i editarea totala sau partiala a unor inregistrari corespunzatoare rezultatului 
unei intrebari formulate in acest limbaj. 

Limbajele de manipulare pot fi grupate in doua mari categorii: 

• limbaje autonome - sunt de sine statatoare, in cadrul lor comenzile de manipulare 
reprezinta chiar functii referitoare la utilizarea datelor; 

• limbaje care au nevoie de limbaj gazda - ofera doar facilitate de structurare §i 
cautare, celelalte operatii legate de manevrarea fi§ierelor §i de prelucrare a datelor 
fiind realizate cu ajutorul unor limbaje de nivel inalt universale. 

FUNCTIA DE UTILIZARE 

Functia de utilizare permite comunicarea intre utilizator §i baza de date (sub aspectul 
asigurarii acelor mijloace §i servicii care il avantajeaza cel mai mult pe utilizator). 

Din punct de vedere al functiei de utilizare, utilizatorii pot fi de mai multe categorii: 

■ utilizatori liberi sau conversational^ care au la dispozitie limbaje de interogare 
intr-o forma foarte apropiata de vorbirea curenta §i formeaza grupa utilizatorilor 
a§a-zi§i nespeciali§ti. intrebarile sunt prestabilite, utilizatorii nu cunosc structura 
sau modul de lucru cu baza de date §i se rezuma la apelarea unor proceduri sau 
programe corespunzatoare anumitor aplicatii; 

■ utilizatorii parametrici fac uz, de regula, de limbajele de manipulare (in special 
pentru interogare) utilizand proceduri prestabilite. Ei au cuno§tinte de programare 
§i cunosc atat structura bazei de date cat §i problemele sistemului de operare; 

■ administratorul bazei de date este un utilizator special, care raspunde de toate 
activitatile §i operatiile referitoare la baza de date pe care o gestioneaza, inclusiv 
performantele acesteia. El defme§te obiectivele sistemului, ajuta la definirea 
cerintelor utilizatorilor, defme§te structura virtuala §i imparte drepturile de acces 
ale utilizatorilor, stabile§te procedurile de validare a datelor, elaboreaza conceptia 
de protectie a datelor §i evalueaza performantele sistemului. Administratorul ras- 
punde de alegerea §i implementarea SGBD-ului, asigura incarcarea bazei de date, 
defme§te strategia de lucru §i distribuie documentatia tuturor utilizatorilor. 

Pentru orice aplicatie de baze de date de dimensiuni medii sau largi exista cel 
putin o persoana cu sarcini de administrare. Aceste persoane (i.e. administratorii bazei 
de date) stabilesc politicile de utilizare §i au grija ca ele sa fie respectate. Functiile 
specifice de administrare pe care o SGBD trebuie sa le ofere sunt: (i) start/stop aplicatia 
de baze de date; (ii) functii pentru definirea grupurilor de utilizatori §i pentru controlul 
accesului; (iii) functii de arhivare, salvare §i restaurare; (iv) functii de control al 
securitatii §i integritatii datelor; (v) importul/exportul datelor; (vi) functii pentru 
monitorizarea utilizarii sistemului §i aplicarea ajustarilor necesare. 

Dintre cele mai utilizate SGBD-uri: Oracle, Access, MySQL, Sybase, FoxPro, 
Paradox, dBASE. 
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4. TIPURI DE BAZE DE DATE. MODELE DE DATE 

Putem clasifica bazele de date astfel: 

a) Dupa distributia datelor: 

al) BD locale - toate fi§ierele care compun baza de date se gasesc pe un acela§i 
sistem de calcul, 

a2) BD distribuite - fi§ierele care compun baza de date sunt distribuite pe mai 
multe sisteme de calcul, 

b) Dupa modelul de date (i.e. specificatiile de arhitectura a datelor). Modele clasice 
sunt: 

bl) BD relationale, 
b2) BD ierarhice, 
b3) BD in retea. 

Modelul de date este o reflectare a modelului conceptual, care reprezinta “lumea reala” 
prin concepte de tip entitate, relatie §i atribute. O entitate este un anumit aspect al 
acestei “lumi reale”, care are o existenta independents §i poate fi identificat in mod 
unic. Toate modelele clasice pastreaza inregistrarea ca orientare fundamentals. 

BAZE DE DATE RELATIONALE 

Acestea sunt cele mai utilizate baze de date, pentru ca sunt u§or de inteles §i de 
manevrat. Structura lor logicS este de tip tablou cu relatii intre linii §i coloane. Ne 
imaginSm ca baza de date din figura 1.6 contine informatii privind pacienti purtStori ai 
unei maladii ereditare, motiv pentru care s-au luat in observatie §i descendentii acestora. 


BD relationale 


Nr.reg. 

Nume 

Sex 

Nr.reg.copii 

Nr.reg. lab. 


P2074 

IONESCU ADRIAN 

M 

C015 

L9477 


P2075 

ADAM LAURA 

F 

C109 

L5293 















Fi§ier P 
(pacienti) 


Nr.reg 

Nume 


Nr.reg.par. 




P2074 














Fi^ier C 
(copii) 


Nr.reg. 

Nr.pacient 

Colest 

Qlicemie 


■KEMfl 

P2074 









i 






Fi^ier L 
(lab orator) 


Figura 1.6. Bazele de date relationale sunt organizate ca ni§te tabele cu relatii intre linii §i 
coloane (in acest exemplu numarul de registru este informatia care face “conexiunea” intre 

cele trei fl§iere) 


Cautarea in baza de date se face prin comparatie intre criteriile de cautare §i datele 
propriu-zise - valoarea de adevarat/fals, obtinuta ca rezultat, conducand la crearea unor 
inregistrari virtuale, care formeaza apoi tabele virtuale. Aceste tabele virtuale se obtin 
ca rezultat al cautarii §i ele contin raspunsul la intrebari de genul: “Care sunt rezultatele 
obtinute la ultimele analize de laborator de pacientul IONESCU ADRIAN §i de copiii 
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acestuia?”, sau “Exista inregistrate datele privind evolutia parintilor lui IONESCU 
ADRIAN? Daca da, care sunt ele ?”. 

Aceste criterii de cautare se stabilesc de catre utilizator, iar modificarile in relatiile 
logice dintre campurile §i inregistrarile bazei de date se defmesc §i se modifica cu un 
efort minim. Bazele de date relationale sunt foarte flexibile §i u§or expandabile. 

BAZE DE DATE IERARHICE 

Diagramele unor asemenea baze de date sunt arborescente: fiecare element este 
subordonat unui singur element de pe nivelul precedent al bazei de date §i numai unuia. 
Dependenta unui segment de alte segmente de date de nivel superior se exprima printr- 
un punctator (adresa), ceea ce conduce la o economie considerabila de spatiu §i se 
simplified regasirea informatiilor de baza. 

Prin aceasta organizare eficienta timpul de prelucrare se scurteaza substantial. 
Plata pentru aceasta eficienta este o suplete mult mai scazuta la schimbarea procedurii 
de prelucrare. Pentru volume mari de date §i prelucrari intense, avantajele oferite sunt 
insa determinante. 

BAZE DE DATE IN RETEA 

Bazele de date in retea sunt asemanatoare cu cele ierarhice, doar ca un “copil” 
poate avea mai mult decat un singur "parinte", ceea ce le face mai flexibile dar §i mai 
putin eficiente in operative de interogare. 


MODELUL RELATIONAL DE REPREZENTARE §1 REGASIRE A 
DATELOR. CARACTERISTICILE SGBD-urilor RELATIONALE 

Exista cateva familii mari de limbaje relationale: 

a) Limbajele orientate pe transformari - constituie o clasa de limbaje nepro- 
cedurale care, cu ajutorul relatiilor transforma datele de intrare in ie§irea dorita de utili- 
zator. Aceste limbaje (cel mai cunsocut este SQL - Structured Query Language) produc 
structuri u§or de inteles §i de manipulat in termeni practici: ce trebuie obtinut, pornind 
de la ce este cunoscut (descriu doar modul in care datele sunt organizate §i pot fi 
regasite). 

Caracteristici: au nevoie de limbaj gazda §i trebuie incluse in pachetele de aplicatie. 

SQL a cucerit piata atat datorita calitatilor sale, cat §i faptului ca a fost 
standardizat de catre ANSI ( American National Standards Institute) §i a fost initial 
promovat de catre IBM. 

b) Limbaje bazate pe algebra relationala - utilizeaza o serie de operatori 
algebrici relationali (permutare, proiectie, restrictie, selectie, impartire, reuniune, inter- 
sectie, diferenta, concatenare etc.). 

Limbaj ul algebric relational este un limbaj procedural complet, dar dificil 
pentru necunoscatori. El se bazeaza pe utilizarea unui ansamblu de operatori cu ajutorul 
carora se actioneaza asupra uneia sau mai multor relatii din cadrul unei baze de date 
relationale, drept rezultat obtinandu-se o noua relatie. 

c) Limbaje relationale de tip grafic - modul de lucru: utilizatorul 
completeaza o serie de raspunsuri, pe un exemplu, prin care sistemul M ghice§te ? ' ce 
trebuie facut §i genereaza instructiuni corespunzatoare ale limbajului. 
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PROBLEME SOCIALE 

Ca §i in cazul altor tehnologii, exista aspecte variate §i uneori controversate 
legate de utilizarea bazelor de date electronice. Ele se asociaza mai ales cu problemele 
de securitate a datelor §i cu faptul ca se pot interoga colectii uria§e de date aflate la 
distante mari, cu un efort minim. 

Sunt §i cazuri in care apar probleme legate de dreptul de a colecta §i utiliza 
informatia inca de la inceput sau dreptul de a da informatia colectata catre terte parti. 
Multe dintre aceste probleme sunt inca fara un raspuns clar - exemple adaptate dupa 
[Brookshear 2007]: 

• in ce masura poate o universitate face uz de datele despre studentii sai: (a) 
numele §i adresele; (b) notele? Poate face publica distributia notelor fara a da 
numele? 

• in ce masura poate un spital sa faca uz de informative referitoare la pacienti - 
poate folosi datele pentru cercetare? Se schimba ceva daca datele sunt de- 
identificate? Le poate da unor institute care fac cercetare farmaceutica? 

• in Statele Unite exista inregistrata informatie ADN despre toti detinutii 
federali, iar baza poate fi consultata in situatia unor investigatii criminalistice - 
este etic ca aceasta informatie sa fie utilizata §i pentru cercetare genetica? 

• poate o banca sa dea informatii referitoare la obiceiurile de cheltuieli ale 
clientilor? Cand, in ce conditii? 
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BIOSTATISTICA 




INTRODUCERE IN BIOSTATISTICA 


Marea majoritate a cuno§tintelor manevrate in §tiintele naturii, inclusiv cele 
medicale se bazeaza pe observatii §i studii asupra mediului. Una dintre caracteristicile 
care frapeaza de la inceput este variabilitatea. Indivizii au diferite inaltimi, greutati, 
etc. Am observat insa cu totii ca variable observate sunt relativ limitate in intervale pe 
care le consideram “rezonabile” sau “normale” iar ie§irea inafara intervalului reprezinta 
cel mai adesea ie§irea din sfera a ceea ce numim “normal”. Privind astfel lucrurile am 
putea spune ca §tiintele medicale se ocupa cu depistarea acestor variatii, cauzele §i 
metodele de re venire in domeniul valorilor normale. De fapt trebuie sa se inceapa cu 
defmirea limitelor in care incadram “normalul”. Putem deja sesiza ca acest lucru nu este 
deloc u§or fiindca vom stabili aceste limite print-un studiu asupra unui grup de indivizi 
pe care ii consideram “normali” inca inainte de a avea definit normalul. Vom mai 
observa ca variabilitatea poate fi destul de ridicata; in plus, repetand studiul pe un alt 
grup obtinem alte limite, deci apar semne de indoiala privind stabilirea limitelor §i va fi 
fireasca intrebarea: “cum putem defini un interval rezonabil §i cat de mare incredere 
putem avea in compararea unei situatii reale cu aceste date generale”? Acesta este rolul 
biostatisticii, care pe baza unei fimdamentari matematice solide, in special teoria 
probabilitatilor, ne permite sa ne orientam printre datele atat de diverse ca cele oferite 
de viata de zi cu zi. Caracterul probabilist al interpretarilor este oarecum contestant cu 
modelul “exact” impus de educatia uzuala din matematica; de aceea se sustine ca 
statistica nu este doar o §tiinta, ci un mod de gandire; in matematica numerele 130 §i 
135 sunt evident diferite; in gandirea statistica nu vom mai fi atat de siguri ca sunt 
diferite (daca ar fi vorba de exemplu de doua masuratori de tensiuni arteriale sistolice 
ale unui individ vom ajunge probabil cel mai des la concluzia ca nu sunt diferite!). 

Ca orice §tiinta, biostatistica opereaza cu cateva concepte de baza care vor fi 
prezentate in cele ce urmeaza. 


1. INFERENTA STATISTICA 

1.1 CONCEPTELE DE BAZA ALE BIOSTATISTICII 

A. Individ populatie 

Definitie. Individ (element, unitate statistica) - concept de baza ce reprezinta forma 
individual^ caracteristica fenomenului studiat §i supusa operatiei de masurare a unor 
parametri (marimi). 

Un individ este considerat bine definit daca este: 

■ identificat concret 

■ localizat in timp (moment sau interval in care se considera ca nu se modifica 
sensibil caracteristicile studiate) 

■ localizat in spatiu. 

Exemplu: intr-un studiu asupra dezvoltarii copiilor, notiunea de individ este asociata 
unui copil anume, fiind precizat §i momentul in care s-au efectuat masuratorile precum 
§i localizarea spatiala a studiului. 
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Observatie: “individ” nu este neaparat o persoana; intr-un studiu facut pe 
§obolani, individul va fi un §obolan, intr-o proba de sange va fi o hematie etc. 

Definitie: Populatie (colectivitate statistica) reprezinta ansamblul tuturor indivizilor la 
care se refera studiul §i care au cel putin o proprietate comuna. 

Populatia este bine defmita daca este: 

- localizata in timp 

- localizata in spatiu 

- identificata caracteristica ce este comuna indivizilor din populatie. 

Observatii: 

- numarul de indivizi dintr-o populatie se nume§te volumul populatiei 

- populatiile pot fi finite sau infinite 

- indivizii i§i pierd individualitatea in interiorul unei populatii. 

Exemple de populatii: - copiii in varsta de 10 ani din judetul Timi§, in anul 1995 

- limfocitele T ale bolnavilor de hepatita B. 

B. Obiectul §i metodele biostatisticii 

Definitie: Biostatistica este disciplina care i§i propune studiul caracteristicilor unei 
populatii. 

Metode de studiu pentru evaluarea caracteristicilor populatiei: 

- recensamant - metoda de determinare exacta a caracteristicilor populatiei; 
localizarea in timp este restransa la un moment; tot foarte bine precizata este §i 
delimitarea spatiala. Recensamantul este o operatie laborioasa §i foarte costisitoare find 
utilizat rar, pentru culegerea unor date exacte strict necesare. Deseori in practica nu este 
necesara precizia oferita de recensamant, find suficiente date aproximative, studiile 
devenind mult mai ieftine. 

- screenning - metoda asemanatoare recensamantului utilizata de obicei pentru 
depistarea in cadrul unei populatii a indivizilor avand o abatere deosebita a unui 
parametru (depistarea precoce a unor afectiuni grave sau cu consecinte deosebite); nu 
este necesara localizarea in timp cu strictetea recensamantului. Fiind o operatie destul 
de costisitoare, eficienta create prin alegerea unei selectii din populatie conform unor 
factori de rise; exista o intreaga metodologie pentru optimizarea screeningurilor. 

- selectie (e§antionare) - metoda cel mai des folosita oferind rezultate cu precizie 
satisfacatoare §i un cost mult redus; pentru studiu se alege din populatie o submultime 
numita e§antion (lot, grup), masuratorile fiind efectuate numai pe indivizii e§antionului 
studiat. 

C. Inferenta statistica 

Rezultatele obtinute pe un e§antion le vom considera valabile pentru intreaga 
populatie. 

Definitie: Operatia de generalizare a caracteristicilor unui e§antion la nivelul intregii 
populatii se nume§te inferenta statistica. 

Inferenta statistica este operatia fimdamentala a statisticii §i in jurul ei graviteaza 
majoritatea aspectelor teoretice. Importanta acestei operatii poate fi mai bine sesizata 
daca ne gandim ca e§antionul poate sa reprezinte un procent infim din intreaga 
populatie (sa zicem 1:1000); putem foarte u§or aluneca spre concluzii eronate daca 
e§antionul nu reprezinta intreaga diversitate pe care o intalnim in populatie. Sa ne oprim 
deci putin asupra operatiei de selectie in e§antion (teoria selectiei). 
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D. Esantion reprezentativ 

Definitie: E§antionul care contine proportional indivizi reprezentand toate 
caracteristicile populatiei poarta numele de e§antion reprezentativ. 

Criterii pentru e§antionul reprezentativ 

O serie de concluzii interesante pentru statistic*! s-au putut desprinde cu ocazia 
sondajelor efectuate in peajma alegerilor, partidele politice fiind deosebit de interesate 
de aceste rezultate. Institutiile care se ocupa cu efectuarea acestor sondaje utilizeaza de 
obicei e§antioane reprezentand - 1:1000 - 1:100 din populatie. Este des pomenita in 
cartile de statistic*! o intamplare cu ocazia alegerilor din SUA din anul 1936. in sondajul 
efectuat de revista “The Literary Digest” cu putin inainte de alegeri, candidatul Alfred 
London parea sa aiba un avantaj sensibil, insa alegerile au fost castigate deta§at de F. D. 
Roosvelt, de§i erorile sunt nea§teptat de mari, daca ne gandim ca sondajul a fost 
efectuat pe cca 10 milioane de alegatori (din cca 40). Explicatia consta insa tocmai in 
alegerea defectuoasa a e§antionului: fiecare al treilea alegator inregistrat din Chicago, 
nume alese la intamplare din listele diferitelor cluburi, din cartea de telefon, etc., 
“favorizand” selectia din mediul urban fata de rural, din cei cu venituri mari fata de cei 
cu venituri mici, dintre barbati fata de femei. in plus, sondajul s-a efectuat partial prin 
po§ta §i numai un sfert din cei solicitati au raspuns. S-au putut stabili ulterior reguli 
pentru alegerea e§antioanelor reprezentative care conteaza mai mult decat marimea 
e§antionului. 

Criteriile pentru selectia in egantionul reprezentativ: 

Echiprobabilitate: toti indivizii din populatie sa aiba aceea§i probabilitate de a fi ale§i in 
e§antion. 

Independenta: alegerea unui individ sa fie independents de alegerea altui individ in 
e§antion. 

E. Metode de selectie 

a. Sondajul simplu. Populatia de studiat este considerata omogena §i fiecare 
individ este ales in mod aleator (intamplator) din intreaga populatie. Respectarea 
practica a criteriilor enumerate anterior este dificila datorita mai multor factori: 
subiectivitatea celui ce face e§antionarea, necooperarea unor indivizi selectati, unele 
conditii tehnice (cand “indivizii” sunt animale, celule etc.). De aceea selectia se face, 
pentru populatii finite, prin cartografierea populatiei (numerotarea indivizilor luati in 
evidenta) §i apoi generarea de numere aleatoare (sau folosirea unor tabele de numere 
aleatoare) care precizeaza indivizii selectati. 

b. Sondajul dirijat. Populatia este deseori heterogena §i poate fi divizata in mai 
multe categorii, numite “straturi” in teoria selectiei. (De exemplu un e§antion 
reprezentativ pentru populatia tarii noastre trebuie sa cuprinda proportiile cuvenite de 
barbati respectiv femei, de persoane din mediul rural sau urban, din diferite regiuni ale 
tarii). in sondajul dirijat se vor selecta in e§antion un numar de indivizi din fiecare strat, 
proportional cu ponderea stratului in populatie. in interiorul fiecarui strat se aplica 
regulile sondajului simplu. Exista mai multe variante pentru punerea in practica, cel mai 
adesea, (in anchetele starii se sanatate) alegandu-se din fiecare strat localitati §i 
e§antionare aleatoare (gospodarii, nr. indivizi) din localitatile alese. 

c. Sondajul mixt. Versiune care imbina sondajul dirijat cu cel simplu. 

Trebuie mentionat aici ca exista o serie de reguli (ce vor fi in parte discutate 

ulterior) prin care se stabile§te numarul minim de indivizi din e§antion pentru studiul 
propus. 
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F. Tipuri de e^antioane 

De§i dorinta noastra, in cursul selectiei e§antionului, este cel mai adesea cea de a 
evita orice factori care ar influenta echiprobabilitatea, constatam ca, practic, numero§i 
factori au tendinte, uneori puternice, de a afecta acest criteriu fundamental. De exemplu 
daca dorim sa selectam pentru o experinta un lot de §oareci din biobaza (crescatorie), 
este posibil sa apara factori subiectivi (ingrijitoarele au uneori “simpatii” pentru 
animalele ingrijite - unii §oareci sunt mai draguti, cu mustati mai lungi etc. §i incearca 
amanarea unui eventual destin tragic) sau obiectivi (daca alegerea unor §oareci la 
intamplare dintr-o cu§ca inseamna a lua pe cei pe care ii poti prinde deja putem sesiza 
ca ii vom prinde pe cei mai putin abili in a evita capturarea lor - cu alte cuvinte 
alegerea nu mai este chiar intamplatoare; in aceasta categorie intra §i sondajul prin 
po§ta: serozitatea de a raspunde la un sondaj nu este egal distribuita in toate straturile!). 
Definitie : un factor (tendinta) care influenteaza probabilitatea de selectie a unui individ 
intr-un e§antion se nume§te bias. 

in fiinctie de prezenta sau absenta unui astfel de factor in procesul de selectie 
putem distinge: 

- e§antioane neselective (“unbiased”) - care respecta echiprobabilitatea 

- e§antioane selective (“biased”) in care, cu sau fara §tirea noastra, un factor a 
influentat componenta lotului. in marea majoritate a cazurilor e§antioanele selective 
sunt evitate; exceptie fac studiile din “analiza riscului” unde ace§ti factori sunt chiar 
cautati pentru eventuala defmire a unor “straturi”. 

1.2. Variabile 

Studiile experimentate, indiferent de natura lor, se concretizeaza prin culegerea 
unor date. 

A. Definitie 

Marimile asupra carora este orientat un studiu §i se culeg date poarta numele de 

variabile sau caracteristici. 

B. Tipuri de variabile 

a. Variabile numerice (se mai numesc cantitative sau cardinale) sunt cele ale 
caror valori sunt exprimate prin numere, pornind de la o unitate de masura bine 
defmita. Valoarea numerica propriu-zisa depinde de unitatea de masura §i de precizia 
instrumentului de masura. 

Exemple de variabile numerice: 

- inaltimea unui individ (talia) se exprima de obicei in cm sau m (in picioare §i inch in 
unele tari anglo-saxone); 

- greutatea - de obicei in kg cu precizia de 1 kg pentru adulti §i lOg-lOOg pentru copii 
(in “pounds” §i “ounces” in unele tari anglo-saxone); 

- frecventa cardiaca - se exprima in batai/minut; 

- pH-ul sanguin - se exprima in unitati pH, etc. 

Variabilele numerice pot fi de doua tipuri: 

- scara proportionate: valoarea zero-originea- este aceea§i indiferent de unitatea de 
masura 

- scara de intervale: la schimbarea unitatii de masura raman proportionale numai 
intervalele (ex: temperatura in 0 C §i °F). 

Variabilele cantitative se mai pot imparti in: 

- variabile continue - exprimate prin numere reale (ex: pH-ul sanguin) 
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- variabile discrete - exprimate prin numere intregi sau rationale, avand numai anumite 
valori posibile (ex: frecventa cardiaca). 

in practica, datorita preciziei limitate a instrumentelor cu care se efectueaza 
masurarile, putem aborda toate variabilele ca discrete; deseori nici nu este necesara 
impingerea precizie masuratorilor la maximul tehnic posibil, fiind suficienta o precizie 
limitata, specificata dupa necesitati (ex: greutatea unui individ). 

b. Variabile ordinale (se mai numesc variabile rang) - sunt exprimate prin 
numere conform unei scari (scale) conventionale care accepta relatia de ordine (mai 
mare, mai mic, egal) sau ata§eaza eventual valori numerice conform unor criterii 
conventionale. Specific variabilelor ordinale este exprimarea prin numere, dar absenta 
unei unitati de masura. 

Exemple de variabile ordinale: 

- “nota” obtinuta de un individ la un examen indiferent de forma de examinare; nota nu 
este altceva decat reflectarea sub forma de numar a pozitiei pe o scara cu trepte 
conventionale: nu se poate niciodata afirma ca “diferenta” (distanta) intre 9 §i 10 “este 
egala” cu diferenta (distanta) intre 5 §i 6! 

- “ierarhia” in scara Luscher de preferinta a culorilor dintr-o paleta de 6 (sau 8) culori 
date 

- gradul de apreciere al efortului pe scara Berg (0-20 de la “f.f.u§or” pana la 
“epuizant”); etc. c. Variabile calitative (se mai numesc nominale) - sunt exprimate 
prin nume sau simboluri ce defmesc diferite “clase” de calitati; intre calitatile claselor 
nu se poate (in general) stabili o relatie de ordine; cele mai frecvente sunt calitatile 
definite dihotomizant astfel incat sa apara numai doua clase; teoria demonstreza ca toate 
celelalte cazuri se pot reduce in final la abordarea dihotomica (cu doua clase); 
variabilele cu numai doua valori posibile se mai numesc §1 variabile alternative. 

Exemple de variabile calitative: 

- grupa sanguina: O/A/B/AB - patru valori posibile 

- sexul: M/F - doua valori posibile 

- starea pacientului dupa tratament: ameliorat/neameliorat - doua valori posibile, etc. 

C. Caracteristicile variabilelor 

Pentru un individ (obiect) valoarea asociata variabilei este defmita pentru un 
moment dat. De obicei culegem un ansamblu de valori corespunzand indivizilor din 
e§antion urmand ca, prin inferenta statistic^, sa incercam sa caracterizam starea 
populatiei la momentul respectiv. 

in cazul in care urmarim §i evolutia in timp a valorilor variabilei studiate 
obtinem o serie temporala care ne da o reprezentare dinamica, in timp, a marimii 
studiate. Putem intalni serii de momente sau serii de intervale. 

Uneori studiul se indreapta spre sesizarea unor diferente in functie de repartitia 
in spatiu a valorilor individuale; in acest caz obtinem o serie spatiala. 

D. Marimi deterministe §i aleatoare 

a. Marime determinista - este o marime a carei valoare este bine defmita la un 
moment dat §i care prin repetarea masurarii ne a§teaptam sa obtinem din nou aceea§i 
valoare. Eventualele variatii se pot datora numai operatiei propriu-zise de masurare. 

Exemple: lungimea unui obiect , concentratia unei solutii etc. 

b. Marime aleatoare (sau statistica) - este o marime a carei valoare nu se repeta 
cu necesitate prin repetarea masuratorii, chiar daca incercam sa pastram nemodificate 
conditiile experimentale. 
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Exemple: rezultatul la aruncarea zarului (6 valori posibile) sau numarul de 
dezintegrari/secunda al unei surse radioactive (cu variatii intr-un anumit interval), 
structura genomului unui descendent (cu cateva variante posibile). Procesele care 
genereaza marimi statistice se mai numesc §i stochastice. 


2. PARAMETRII STATISTICS 

in biostatistica se utilizeaza frecvent introducerea unor notiuni pornind de la 
exemple, metoda pe care o vom utiliza §i noi in continuare. 

Exemplul 1: Efectuam un studiu privind dezvoltarea copiilor din Timisoara in 
1995. Fuarn un e§antion de 324 copii in varsta de 10 ani din Timisoara obtinand valorile 
din tabelul de mai jos. 


Tabelul 1 . Datele cu inaltimile unui grup de copii 



1 1 inaltime 

Frecventa 


Inaltime 

Frecventa 


Inaltime 

Frecventa || 

126 

1 


134 

25 


142 

13 

127 

1 


135 

28 


143 

12 

128 

3 


136 

34 


144 

8 

129 

4 


137 

37 


145 

3 

130 

7 


138 

30 


146 

2 

131 

12 


139 

31 


147 

2 

132 

11 


140 

22 


148 

0 

133 

19 


141 

18 


149 

1 


Datele din acest tabel pot fi reprezentate grafic sub forma unei histograme (fig. II. 1) 


Analizand aceste date, putem observa ca: 

- valorile foarte mici sau foarte mari (extremele), sunt rare, majoritatea valorilor fiind 
situate in zona centrala; acest aspect va fi surprins de unii parametri caracteristici numiti 
“indicatori ai tendintei centrale” 

- variatiile in jurul parametrului tendintei centrale pot fi mai mari sau mai mici (valorile 
individuale pot fi mai grupate sau mai impra§tiate); acest aspect va fi surprins de alti 
parametri numiti “indicatori de dispersie”. 



Figura II.l. Histograma inaltimii unui grup de copii 
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2.1. Indicat orii tendintei centrale 

in fimctie de tipul variabilei se recomanda folosirea unor diver§i indicatori ai 
tendintei centrale. 


A. Media aritmetica 

Este cel mai folosit indicator al tendintei centrale. Daca avem un e§antion format 
din N indivizi §i notam valorile variabilei studiate cu X h i=l N (citim “indicele i 

luand valori de la 1 la N” ), atunci media aritmetica a variabilei X , notata cu X este data 
de relatia: 


X ly x x l + x 2 +...+x N 

N r-\ 1 N 

1 = 1 


(II. 2.1. a) 


1 . in cazul e§antioanelor mai mari, anumite valori pot sa apara de mai multe ori 
(ca de ex. in tabelul II. 1); daca notam frecventa absoluta de aparitie a fiecarei valori Xj 
cu n j? atunci media aritmetica se mai nume§te medie ponderata §i este data de relatia: 


K 


x = Xy n X: 

N ^ J J 

7=1 


(II.2.1.b) 


unde K reprezinta numarul de clase, iar frecventele respecta relatia: 

K 

N = ^nj (II.2.1.C) 


i=i 


Observatie: in cazul in care o “clasa” j nu contine numai indivizi care au exact aceea§i 
valoare Xj ci apar varitii (deci “clasa” reprezinta de fapt un “straf atunci defmim mai 
intai media stratului j : 

Hi 


x j 


1 J 

n j , 

J i=l 

§i media pe intregul e§antion va fi: 

_ l K Uj 


.7 = 1 i=l 


(II.2.1.d) 


(II.2.1.e) 


2. in cazul unei variabile numerice continue, in loc de frecventa clasei folosim 
valoarea functiei de distribute, deci media aritmetica va fi defmita prin: 

v 

j ^ max 

J/O) dx (11.2.1. f) 


X = 


Y —Y 
^ max ^ mm % 


B. Mediana 

in cazul variabilelor ordinale este mai potrivit a folosi in loc de media aritmetica 
un alt indicator, mediana defmita astfel: 
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Definitie: Mediana este un indicator statistic al tendintei centrale care imparte 
lotul in doua parti egale; 50% din indivizi au valori mai mici decat mediana, 50% au 
valori mai mari. 

Pentru calculul propriuzis al medianei se procedeaza astfel: 

- se formeaza un §ir ordonat crescator al tuturor celor N valori 

- daca N este impar (adica N=2p+1 ), atunci mediana 

M e = X p+1 (II. 2.2. a) 

Valoarea calculate cu (II. 2. 2. a) este considerate exacta daca : 

X p (X p+l (X p+2 (II.2.2.a’) 

- daca N este par (adica N = 2p ), atunci mediana M e este aproximata de 

M - — +Xp+1 (II.2.2.b) 

e 2 

Valoarea data de (II.2.2.b) este considerate exacte dace: 

Xp_i < Xp { Xp+i < Xp + 2 (II.2.2.b ) 

sau 

Vi<V = %i<%2 (II.2.2.b”) 


Dace nu sunt indeplinite conditiile (II. 2. 2. a’), (II.2.2.b’) sau (II.2.2.b”) atunci valoarea 
care se repete de mai multe ori (de n im t ) defme§te un “interval median” de letime h im \ 
mai notem frecventa cumulate pane la intervalul median (pane la limita inferioara 
inclusiv) cu f im ] in acest caz mediana poate fi aproximative cu relatia: 


unde: 


Af = + 


im - 1 

fim ~~ n i 
1=1 




*L- f . 

J in 


(II. 2.2. c) 


(II. 2.2. c’) 


Observatie: De§i nu este recomandabil, destul de des apare calculate media aritmetice 
(fiind mai simplu de calculat) in loc de mediand in cazul variabilelor ordinale. in cazul 
distributiilor simetrice media aritmetice §i mediana coincid; totu§i pentru distributii 
asimetrice ele au valori diferite! 

C. Moda (modul) 

in cazul variabilelor calitative (nominale), media aritmetice sau mediana nu au 
sens; indicatorul tendintei centrale utilizabil se nume§te moda sau mod. 

Definitie: Moda (Mo) reprezinte cea mai frecvente valoare. 

Moda poate fi definite §i pentru variabilele numerice sau ordinale. Pentru 
exemplul din tabelul II.l. moda este de 137 cm. in cazul distributiilor simetrice pentru 
variabilele numerice media aritmetice, mediana §i moda coincid. 


38 




D. Lungeanu, Gh.-I. Mihala§ 


Pozitia relativa a modei, medianei §i mediei aritmetice pentru distribute 
asimetrice este vizibila in figura II.2. 



Figurn II. 2. Moda, mediana §i media aritmetica pentru distributii asimetrice 


Pentru variabile numerice, daca obtinem o curba de distribute cu un singur 
maxim, ea se nume§te unimodala; in cazul in care are doua maxime (chiar daca 
diferite), distributia se nume§te bimodala (fig. II. 3). Similar, pentru mai multe maxime 
putem intalni distributii multimodale. in cazul populatiilor omogene ne a§teptam doar 
la distributii unimodale. Depistarea unei distributii bi sau multimodale este cel mai 
adesea un indiciu al unei populatii neomogene din care s-a extras e§antionul, fiind cel 
mai probabil o suprapunere a doua populatii cu caracteristici diferite. Distributive bi- 
sau multi-modale merita un studiu mai amanuntit. 



Figura II. 3. Distributia bimodala: distributia pragului de sensibilitate pentru detectia 
gustului ”amar” c=concentratia de chinina la care este sesizat gustul amar) 


Observatie: In cazul variabilelor numerice alura graficului de distribute depinde 
puternic de modul in care defmesc clasele (latimea intervalelor). Deseori autorii sunt 
tentati a lua latimea clasei egala cu precizia cu care s-a efectuat masurarea (de ex. 
pentru inaltimea copiilor prezentata in tabelul II. 1 . precizia masuratorii a fost de 1 cm §i 
de aceea in figura II.l. s-a reprezentat distributia conform acestei precizii). in 
biostatistica se recomanda ca numarul de clase utilizat sa nu fie prea mare, astfel incat 

fiecare clasa sa fie destul de reprezentata. Daca se noteaza cu X m §i X M valorile 
extreme gasite (minima, respectiv maxima), si cu N numarul total de indivizi din 
e§antion, atunci latimea unei clase pentru “histograma” poate fi aproximata prin relatia: 


39 


Informatics Medicala & Biostatistica 


h = -A* i — (II. 2. 3) 
l + 3,3221g N 

(Pentru datele din tabelul II. 1 obtinem h « 2,8 « 3 cm deci reprezentarea recomandabila 
ar avea clasele de inaltime ale copiilor de cate 3 cm: 124-126, 127-129, 130-132, 133- 
135, 136-138, 139-141, 142-144, 145-147, 148-150 in total 9 clase in loc de 25). 


D. Alti indicatori ai tendintei centrale 

Foarte rar este posibil a intalni §i alti indicatori ai tendintei centrale: 


- media geometrica: 


( N \ 

n x - 

l/N 

(II. 2.4. a) 



V i=l J 



- media armonica: 

II 

N ^ 
Z— 


(II.2.4.b) 


2.2. Indicatori de dispersie 

Gradul de variabilitate al valorilor individuale intr-o populatie, vizibila intr-un 
e§antion se exprima printr-un set de parametri statistici numiti “indicatori de dispersie”. 
Exista mai multe posibilitati de a exprima acest grad de variabilitate: 


A. Domeniul de valori (amplitudinea; engl. range) 

Este un indicator simplu, furnizand doar informatii asupra ordinului de marime 
al variabilitatii. 


^ - Xmax - X min (II. 2. 5. a) 

unde X min §i X max reprezinta valoarea absoluta minima, respectiv maxima ale variabilei 
analizate. 

Se folose§te mai rar, de obicei in prezentarea partii introductive a studiului, 
limitele varstelor subiectilor dintr-un lot sunt adesea prezentate in acest mod. 


B. Abatarea centrala. Eroarea medie absoluta 

Definitie: Distanta unei valori individuale fata de valoarea medie se nume§te abatere 
centrala: 


e t = X t -X 

Abaterile centrale pot fi pozitive sau negative. Ele au propietatea evidenta ca: 


=0 
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De aceea, pentru a caracteriza gradul de variabilitate, se folososesc valorile 
absolute ale abaterilor centrale. O marime ce poate fi folosita ca masura a variabilitatii 
este: 


■ =m = —Y\£ i \ = —Y\x i -x 

N ^ 


§i se nume§te eroare medie absoluta. 


(II.2.5.C) 


C. Deviatia standard 


Amplitudinea, defmita anterior, nu ne spune nimic cu privire la repartitia 
indivizilor intre minim §i maxim. Informatii mai complete primim daca urmarim §i 
aceasta repartitie. 

in figura II. 1 . am prezentat histograma inaltimii pe un grup finit §i destul de mic 
(cca 300), avand o precizie oarecum redusa de exprimare a variabilei (precizia de 1 
cm). 

Ne putem imagina ca, daca am efectua masurari cu precizie mult mai mare, pe 
un lot foarte numeros, am putea obtine curba reala de distribute a inaltimilor intr-o 
populate de copii de varsta data. S-a constatat ca foarte multe marimi observabile in 
natura se pot reprezenta print-o curba de distribute simetrica fata de valoarea medie, 
sub forma unui “clopof ’, numit “clopotul lui Gauss” sau “curba distributiei normale 
(fig. H.4). 

Ecuatia curbei lui Gauss este: 


m = y 



(x-ju) 2 
e~ 2ct2 


(II. 2. 6. a) 


Observam ca in ecuatie apar 2 parametri: // §i a. 

. /ii este indicatorul tendintei centrale, reprezinta “media” §i este valoarea in 
jurul careia curba este simetrica; 

. C este indicatorul de dispersie, se nume§te “deviate standard” sau “abatere 
standard” §i arata gradul de impra§tiere a curbei in jurul mediei. 

Deviatia standard in curba lui Gauss permite urmarirea repartitiei valorilor 
individuale in jurul valorii medii conform fig. II.4. 



Figura II. 4. Distributia normal 
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Analizand figura putem spune ca valorile individuate X j se vor gasi in 
intervalele: 

X t e (, ju — CT,ju + (j ) in 68% din cazuri 

X t G (jU - 2(7 , ju + 2(7 in 95,4% din cazuri 

(II.2.6.b) 

X. e (jU -3(7, jU + 3cr) in 99,7% din cazuri 

in cazul lucrului pe un e§antion, in loc de media populatiei /LL se va folosi 

media e§antionului, X , iar in loc de deviatia standard a populatiei se va folosi deviatia 
standard a e§antionului (abatere standard) care se calculeaza cu relatia: 


s = 



S 


n - 1 


(II. 2. 7. a) 


Exemplu: in urma unui studiu pe un e§antion format din n = 25 copii de 10 ani, 
in care am gasit inaltimea medie X = 137 cm §i deviatia standard S = 5 cm putem 
afirma ca cca 68% din copiii de 10 ani au inaltimea cuprinsa intre 132 cm ( X — S) §i 

142 cm ( X + S), cu alte cuvinte, probabilitatea ca inaltimea unui copii sa fie intre 132 - 
142 cm este 68%. 

in general, vom scrie astfel: 

X t g(X-S, X + S) 

X. e(X-2S, X+2S) 

X t g(X-35, X + 3S) 


cu p = 68,3% 

cu p = 95,4% (II.2.6.C) 

cu p = 99,7% 


Definitie: putem acum defini deviatia standard: S reprezinta gradul de variatie a 
valorilor individuate in jurul mediei e§antionului. 

Marimea 

S 2 =— Y(X i -X) 2 (II. 2.7. b) 

n - 1 


se nume§te dispersie, sau abatere patratica sau varianta. 

Deseori se raporteaza indicatorul de dispersie la valoarea medie obtinand o noua 
marime numita coeficient de variatie exprimat in procente prin: 

C.V. = 100*S/ X (II. 2.7. c) 

Fiind o marime relativa, se pot compara cu ajutorul ei serii avand valori cu 
ordine de marimi diferite. 

Pentru loturi foarte mari, in formulele (II. 2. 7. a) §i (II.2.7.b) se folose§te n in loc 

de n-1. 


D. Eroarea standard a mediei 

Scopul principal al unui studiu statistic este carcterizarea populatiei, nu a 
e§antionului. Din exemplul folosit pana acum, am putea oare raspunde la intrebarea 
“Care este inaltimea medie a copiilor de 10 ani din Timisoara?” Este mare tentatia de a 
raspunde: 137 cm (media e§antionului). Nu se poate insa sa nu ne dam seama ca este 
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foarte posibil ca, repetand masuratorile, pe un alt e§antion, sa obtinem alta valoare 
medie, de exemplu 135,8; pe un al treilea e§antion 137,6 §i a§a mai departe. Este vreuna 
din aceste valori mai demna de incredere decat celelalte? Nicidecum! Valoarea 
adevarata a mediei populatiei, p, se poate obtine experimental numai facand masuratori 
pe intreaga populatie. Concluzia pare demoralizanta la prima vedere. Totu§i, adesea nu 
este necesara cuno§terea foarte exacta a unui parametru, fiind suficienta incadrarea lui 
intr-un interval suficient de ingust. Sa vedem care sunt caile pentru estimarea acestui 
interval. 

Presupunem ca din populatia studiata facem masuratori pe toate e§antioanele 
posibile de aceea§i dimensiune n , obtinand mediile X x , X 2 . . . , , X T . Vom avea 

evident media populatiei: 

(II.2.1.g) 

1 7=1 


Analizand distributia acestor medii ale e§antioanelor vom observa (fig. II. 5. a) ca §i ele 
se aranjeaza aproximativ dupa o curba Gauss, (daca e§antioanele sunt destul de mari, n 
> 30) avand fata de curba din fig. II.4. doua deosebiri: 

a. variatiile mediilor e§antioanelor se intind pe un interval mult mai ingust 
decat variatiile valorilor individuale; 

b. valoarea in jurul careia sunt simetrice variatiile este media populatiei. 




Figura II. 5. Distributia mediilor e§antioanelor 


Distributia mediilor e§antioanelor este caracterizata prin parametrii p = media 
populatiei §i <j - = eroarea standard a mediei data de formula: 

<7 f = G I 4N (II. 2. 8. a) 

unde N = volumul populatiei §i a = deviatia standard. 

Sa aplicam formula (II. 2. 8. a) care pentru exemplul nostru concret devine: 

S 2 = A (II.2.8.b) 

yin 
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pentru esantioane foarte mari, iar pentru esantioane mici folosim 


5 

_ r m 

\ In 


N-n 
N - 1 


unde n = mr. indivizi din e§antion, N = volumul populatiei. 
Deci inlocuind datele din exemplu avem: 


(II.2.8.C) 


S- =5/V25*lcm 

Conform analizei schematizate in figura II.5.b putem afirma ca 68% din mediile 
e§antioanelor de cate 25 copii vor avea media cuprinsa in intervalul (137 - 1, 137 + 1) 
adica intre 136 §i 138 cm, sau in alte cuvinte, probabilitatea ca media unui e§antion 
oarecare sa fie cuprinsa intre 136 - 138 cm este 68%; Evident, nu pretindem ca §tim cu 
exactitate media populatiei, p , dar avem deja o localizare satisfacatoare a sa, avand 
posibilitatea de 68% de a fi incadrata in intervalul 136 - 138 cm. 

Generalized, putem scrie: 
jue(X-Sx,X+Sx) cu P = 68,3% 


jLi e(X-2Sx,X+2Sx) cu p = 95,4% 


(II.2.8.d) 


JU e ( X - 3S* , X + 3Sjf ) cu p = 99,7% 


Definitie: Eroarea standard a mediei: S% reprezinta gradul de variatie al 
mediilor e§antioanelor in jurul mediei populatiei. 

Cu alte cuvinte, chiar daca printr-un studiu pe un e§antion nu putem preciza cu 
exactitate parametrii caracteristici ai populatiei, putem totu§i sa ii localizam in anumite 
intervale, operatie care se nume§te “estimare” §i care va fi analizata detaliat ulterior. 

Sa observam insa ca avem o relatie de inversa proportionalitate intre posibilitatea 
incadrarii intr-un interval §i latimea intervalului: cu cat suntem mai siguri pe localizare, 
cu atat intervalul este mai larg. De aceea trebuie sa gasim un compromis intre siguranta 
localizarii §i latimea intervalului. Experinta arata ca o localizare cu precizie de 95% este 
satisfacatoare din ambele puncte de vedere §i vom accepta aceasta valoare pe tot 
parcursul cursului nostru. 

E. Indicatori de dispersie ai variabilelor ordinale 

Indicatorii de dispersie descri§i anterior, deviatia standard §i eroarea standard a 
mediei sunt folositi in special pentru variabilele cantitative propriu-zise. in cazul 
variabilelor ordinale, de§i se poate folosi §i deviatia standard (§i eroarea standard a 
mediei), se recomanda folosirea unor indicatori specifici. Pentru a intelege ace§ti 
indicatori de dispersie vom introduce mai intai alti parametri: 

a. Cuantile. Indicatorul tendintei centrale specifice variabilelor ordinale, 
mediana, era defmita ca valoarea care imparte lotul in doua parti egale. 



Q1 Q2 =Me Q3 

X | X I X | X X | Xx | x XjK X I X I X | X X | X X k 

D2 D3 D4 DJ D6 D7 DS D9 


Figura 11.6. Mediana, Cuartile, Decile pentru N=20 
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Putem, prin analogie, defini diverse alte marimi numite cuantile: ca fiind 
valorile care impart lotul in n subclase echinumerice. Denumirile lor sunt prezentate in 
tabelul II. 2 . 


Tabel II.2. Cuantile uzuale 


| Nr. clase 

Simbolul valorilor 

Denumire 

Observatii | 

2 

Me 

mediana 


4 

Ql, Q2, Q3, 

cuartile 

Q2 = Me 

10 

Dl, D2, D9 

decile 

D5 = Me 

100 

C1,C2,... C99 

centile 

C50=Me 

CIO = Dl, etc. 

1000 

P4, M2, ...,M999 

promile 

M10 = Cl... 


b. amplitudinea intercuatile (variatie intercuatile): 

Q ed =C 3 ~Qj2 (II.2.5.b) 

este o masura a variabilitatii, valorile mai mari exprimand o variabilitate mai mare 
c. coeficientul de variatie inter-cuartil: 

r n- Ql - 63-61 (II.2.5.C) 

Q ' K Q } + 0 , 

joaca rolul coeficientului de variatie dat de (II.2.7.c) §i are valori intre -1 §i +1. 

F. Indicatori de dispersie ai variabilelor nominale 

Pentru variabilele nominale indicatorul preferat al tendintei centrale este moda; 
fiecare calsa i este caracterizata prin procentul din e§antionul de volum n: 

Pi = 100 A (II. 2. 9. a) 

n 

unde n i este frecventa absoluta a clase i. 

Deviatia standard a procentului este data de relatia: 


s* - 


Pi Vi 


n 


unde: q i =l00-p i 

in cazul unei populatii finite de volum N 




IYI, 


i'll * 


N-n 
N — l 


(II.2.9.b) 


(II.2.9.C) 


(II.2.9.d) 
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Pentru e§antioane sufficient de mari, procentul in e§antion are distribute normala §i 
permite interpretari similare cu cele prezentate anterior. 


2.3. Medii de puteri: momente. Momente centrate 


Abordarea teoretica a parametrilor statistici caracteristici unui set de valori 
permite generalizarea unor relatii. Sa ne oprim putin la defmitia mediei aritmetice. 


x = —Yx i 

1 


Aceasta marime se mai nume§te §i moment de ordin 1, valorile individuale Xf 
fiind ridicate la puterea 1 §i apoi mediate. 

Prin generalizare numim moment de ordin r marimea: 


X- 


1 r 

-ix r 
N i 


(II. 2.7. d) 


Pentru r = 2, X 2 este media patratica, pentru r = 3, X este media cubica, 
pentru r = - 1 , X h este media armonica. 

Daca in locul valorilor individuale folosim abaterile centrale, momentele 
obtinute se vor numi momente centrate, deci pentru momentul centrat de ordin r avem 
formula: 


m cr=^T( X ‘- X y (11.2J.C) 

Observam ca pentru r = 1 avem m cl = 0, iar pentru r = 2 obtinem m c2 = s 2 
(dispersia). 

Din cele relatate pana aid putem sesiza ca momentele de ordin 1 dau informatii 
asupra indicatorilor tendintei centrale, iar cele de ordin 2, asupra indicatorilor de 
dispersie. Celelalte momente ne dau informatii utile; sa le analizam pe scurt. 


2.4. Asimetria 

Momentele de ordin 3 dau informatii asupra simetriei distributiei. 
a. Se defme§te un parametru numit “indice de asimetrie” (engl. skewness) prin 

relatia: 


m c 3 = ^ T ,( X i - X ') 3 


Pentru M c3 = 0 

distributia este simetrica, 

m c3 <0 

asimetrie la stanga 

m c3 >0 

asimetrie la dreapta (fig. II.2) 


Pentru aprecierea asimetriei s-au propus §i alte relatii: 
b. Coeficientul de asimetrie Pearson: 

M 0 - X 

OC— — 

5 

unde X = valoarea medie 


(II.2.10.d) 


(II.2.10.b) 


(II. 2. 10. c) 
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M 0 = moda 
s = deviatia standard 

Dupa oc distributia este simetrica sau asimetrica la stanga/dreapta la fel ca 


dupa m c3 . (fig. II.7.) 

c. Coeficientul de asimetrie intercuantil: 

o q 3 - M e ) - (M e - a) _ e 3 + a - 2M e 


oc= ■ 


iQ,-M e ) + {M e -Q x ) e 3 -Q 
avand valori intre +1 §i -1, cu 0 pentru distributii simetrice. 
d. Coeficientul bazat pe momentele centrate: 

2 


m 


oc= 


'c3 


m 


'c2 


cu interpretari similare cu indicele de asimetrie. 


(II.2.10.d) 


(II. 2. 10. e) 


2 . 5 . Excesul 

Excesul este un parametru ce da informatii asupra gradului de turtire/boltire 
(limba engleza kurtosis). Se calculeaza cu relatia: 

P= r ^- (II.2.1 l.a) 

m c2 

unde m c4 este momentul centrat de ordin 4 dat de: 



Figura II. 5. Excesul (turtirea / boltirea) 


m c4 = 2-^(X-X) 4 (II.2.1 l.b) 

Pentru distributia normala (3 = 3 

Alte distributii: distributii mai turtite ((3 > 3) sau distributii mai boltite ((3 < 3) - (fig. 
II.8). 
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3. DISTRIBUTII 

Am utilizat free vent termenul de distribute fara sa ne ocupam detaliat de el. 
incercam in cele ce urmeaza sa aducem cateva precizari. 

3.1. Functia de distributee 

Definitie: Daca x este o variabila independents, reprezentand valorile posibile ale unui 
parametru urmarit intr-un studiu statistic atunci fimetia 
y - f (x), cu j = p( x = x ) 

care ne arata probabilitatea de a intalni valoarea x intr-o populatie se nume§te functie 
de distributie. 

Observatii: 

■ uzual se folose§te nu o functie continua ci una discreta, in care valoarea 
functiei reprezinta probabilitatea de a intalni marimea studiata intr-un interval 

(*i > x i+1 ) 

■ vom face distinctie intre distributiile teoretice (in care calculam valorile 
functiei) §i cele experimentale (in care valorile functiei au rezultat in urma 
unor masuratori). 


3.2. Functii de distributie uzuale 

in cele ce urmeaza vom aminti doar trei functii de distributie mai des intalnite: 

a. Distributia uniforma 

f (x[j = p( x = x i) = k (II.3.1.b) 

Experimental se obtin diverse fluctuate (fig. II.6.a) 

Exemplu : probabilitatea de a arunca cu zarul valorile 1-6 este 1/6 pentru fiecare 
aruncare. Dupa 100 de aruncari obtinem o situatie ca in fig. II. 6. a. 

b. Distributia normald descrisa de formula (II. 2. 6. a) avand forma unui clopot. 
Reprezentarea in fig. II. 6. b. 

c. Distributia binomiald (utila in studiul variabilelor calitative) 

Exemplu : probabilitatea de a extrage o bila alba dintr-o urna cu N bile dintre care A bile 
albe §i B bile negre (A+B=N) este: p = A / N. Dupa extragere bila se introduce inapoi in 
urna (Bernoulli). 

Daca din urna se scot n bile atunci numarul x de bile albe extrase are o repartitie 
binomiala: 

f -C x - p* - a* X x = 0,l, ,n (II.3.1.C) 

J (x) n r 1 
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a b c 

Figura 11.6 Distribute : a: uniforma, b: normala, c: binomial 


Functia de repartitie 

Uneori, in loc de functia de distribute, care ne da probabilitatea pi ca variabila 
studiata x sa aiba o anumita valoare (sau incadrata intr-un interval in jurul lui Xi ), se 
folose§te o alta functie numita functie de repartitie : 

y r = p(x<x.) (II.3.1 .d) 




Figura 11. 7. Functia de repartitie pentru distributia uniforma (stanga) §i normala (dreapta) - 
functiile de repartitie sunt redate cu linie intrerupta, iar cele de distribute cu linie continua 


in cazul fiinctiilor experimentale discrete, functia de repartitie ne da frecventele 
cumulate pentru toate clasele inferioare. Pentru distributive uniforma §i normala, 
functiile de de repartitie sunt redate in figura II. 7. 
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Distributia Gauss normalizata 

Functia de distribute normala (Gauss) data de formula (II.2.6.a) este simetrica 
fata de p. Daca am face o schimbare de variabila y = x - ju ea ar deveni simetrica fata 
de origine §i ar mai depinde numai de un parametru: cr . Daca am mai face inca o 
schimbare de variabila, (practic alegand unitati de masura convenabile), putem obtine cr 
= 1 , deci pentru 

Z = ^ (II.3.1.e) 

cr 

obtinem curba de distributia Gauss normalizata (media=0, deviatia standard =1), sau 
distributia Z: 

_z^ 

/(Z)= 1 e 'T (II.3.1.f) 

V2 n 

Deoarece functia Gauss nu se poate integra, valorile functiei de repartitie pentru 
forma normalizata se gasesc in tabele in cartile de statistica; de asemenea, programele 
de prelucrari statistice calculeaza aceste valori. 

in afara de distributiile pomenite pana acum exista numeroase alte tipuri de 
distributii pe care le intalnim in cercetare §i in practica biomedicala. 


4. ESTIMAREA STATISTICA 

Am vazut in paragrafele precedente ca studiul unei populatii se efectueaza 
practic pe o submultime a sa, pe un e§antion, iar concluziile obtinute pe un e§antion le 
vom extinde - prin operatia de inferenta statistica - la nivelul intregii populatii. in timp 
ce concluziile noastre reprezinta afirmatii adevarate efectiv doar pentru e§antion, la 
nivelul populatiei ele au aceea§i valoare de adevar numai cu o anumita probabilitate - 
vom spune ca “estimam” parametrii populatiei pornind de la valorile obtinute pe 
e§antion. Pentru a pastra rigurozitatea exprimarilor consacrate in acest domeniu, vom 
preciza cativa termeni uzuali. 

4.1. Notiunea de estimator 

a. Terminologie 

Marimile caracteristice ale unei populatii se numesc parametri §i au de obicei ca 
simboluri literele grece§ti. Exemple: media populatiei p, deviatia standard a populatiei 
a , eroarea standard a mediei <j - . 

Marimile carcteristice ale unui e§antion se numesc statistici sau indicatori §i au 
de obicei simboluri litere latine. Exemple: media e§antionului X , deviatia standard S, 
eroarea standard a mediei S - . 

Intr-un studiu noi nu cunoa§tem parametrii populatiei ci doar determinam 
statisticile e§antionului, fiecare folosita pentru a aproxima cate un parametru al 

populatiei §i numita estimator. De exemplu: Vom spune ca media e§antionului X este 
un estimator al mediei populatiei p. Deseori estimatorii se noteaza cu simbolul A : 
x = x = est4i sau s = s = est (a). 
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Valoarea pe care o are un estimator intr-o determinare concreta se nume§te 
estimatie. De exemplu in studiul asupra dezvoltarii copiilor, estimatorul pentru 
“inaltimea medie a copiilor de 10 ani “ era ” media inaltimii copiilor din e§antion” iar 
determinarea concreta avea estimatia 137 cm. 

b. Tipuri de estimari 

Conform defmitiilor de mai sus un estimator aproximeaza in general valoarea 
unui parametru; in acest caz el se nume§te estimator punctual. 

Caracteristica esentiala a unui estimator punctual este cea de a fi “nedeplasaf ’. 

Avand in vedere faptul ca prin inferenta noi nu mai pastram o incredere deplina 
in estimarile punctuale, pentru exprimarea probabilista a increderii ramase prin 
inferenta vom incerca localizarea parametrului intr-un interval; vom numi aceste 
aproximatii estimari prin intervale. Aceste estimari sunt cele mai uzuale, iar in cele ce 
urmeaza ne vom referi numai la ele. 

Largimea intervalului de incredere in care vrem sa localizam un parametru este 
dependents de probabilitatea “increderii” pe care o dorim §i anume: cu cat 
probabilitatea de a localiza parametrul este mai mare, cu atat intervalul de incredere este 
mai larg, deci probabilitatea de a gre§i este mai mica, insa cre§terea nivelului de 
incredere nu ne folose§te prea mult daca intervalul devine atat de larg incat nu ne mai 
furnizeaza informatii. Folosind exemplul discutat anterior observam ca daca localizam 
media populatiei cu un nivel de incredere de 68%, intervalul este ingust: (136,138); 
pentru 95% devine (135,139), la 99,7% este (134,140) §.a.m.d. Este deci nevoie de a 
gasi un compromis, un nivel de incredere care sa ofere atat o localizare satisfacatoare 
cat §i o probabilitate ridicata de a fi adevarata localizarea estimata, deci o probabilitate 
mica de a localiza gre§it parametrul. Practica a demonstrat ca un nivel de incredere de 
95% satisface optim cerintele in majoritatea cazurilor concrete. De aceea vom considera 
in continuare ca nivelul de incredere este de 95% (exceptand cazurile in care vom 
mentiona in mod expres ca am ales alta valoare). Atragem insa atentia ca acest nivel 
este conventional. 

Probabilitatea de a localiza gre§it parametrul analizat se noteaza cu a §i se poate 
exprima nivelul de incredere (n.i.) prin relatia: 

n.i. = 1-a (II.4.1) 

c. Principalele tipuri de estimari 

De§i ne-am oprit pana acum in exemplele discutate asupra estimarii mediei 
populatiei, in diferite studii ne putem concentra atentia asupra unei palete mai largi de 
parametri. in cadrul cursului ne vom opri la estimarea urmatorilor parametri: 

- media populatiei - in cazul e§antioanelor mari / mici 

- diferente intre medii 

- proportia unei / unor clase 

- diferente intre proportii. 

4.2. Estimarea mediei populatiei 

A. Pentru e^antioane mari (N > 30) 

a. Distribute mediilor e^antioanelor 

in exemplul cu studiul dezvoltarii copiilor, in care am facut referiri la inaltimile 
copiilor dintr-un e§antion, am afirmat ca, daca reprezentam grafic mediile e§antioanelor 
extrase din aceea§i populatie obtinem o distribute normala numai pentru e§antioane 
mari. 
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b. Formule 

In acest caz, pentru a = 5% (n.i. = 95%) avem: 

fi 6 C - 1,96 S- ; X + 1,96 S- ' (D.4.2.a) 

Valoarea 1,96 reprezinta valoarea functiei Z (distributia Gauss normalizata) 
pentru a cuprinde in intervalul de mai sus 95% din arie (am vazut in cursul precedent ca 
pentru Z = 2 cuprindeam 95,4% din aria de sub curba) (fig. II. 10.). 



Figura II. 10. Relatia lui Z cu pragul de semnificatie a §i cu nivelul de incredere 1 - a 


Aceasta valoare se mai noteaza Z a/2 indicele avand aici semnificatia ca aria 
ramasa neinclusa este a/2 = 2,5% (cate 2,5% in fiecare parte). [Obs: in unele carti se 
noteaza Zi_ a/2 ]. Deci intr-o forma mai 52eneral putem scrie: 

fie$-Z al2 -S- x ',X + Z xl2 -S x ] (II.4.2.b) 

iar pentru Z cx/2 vom lua o valoare din tabelul II. 3. 


Tabel II. 3. Valorile scorului Z al distributiei normale 


Nivel incredere (1 - a) 

0,68 

0,90 

0,95 

0,98 

0,99 

Prag de semnificatie a 

0,34 

0,10 

0,05 

0,02 

0,01 

^oc/2 

1,00 

1,65 

1,96 

2,33 

2,58 


De obicei manualele contin anexe in care sunt prezentate diverse tabele. 
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c. Exemplul II.2. 

Pe un e§antion de 144 sportivi se gase§te pentru VEMS (volumul expirator 

maxim in 1 secunda) valoarea medie X = 4,84 §i deviatia standard S = 0,36. Sa 
estimam in ce interval gasim media populatiei cu nivel de incredere de 98%. 

Avem: s_ = S / Fn = 0,36 / Vl44 = 0,03 l 
Pentru 1 - a = 98% gasim Z x/2 = 2,33, deci: 

X e (4,84 - 0,03 • 2,33 ; 4,84 + 0,03 • 2,33), 

X e ^-,84-0,07 ; 4,84 + 0,07^] adica X e (4,77; 4,91). 

Cu alte cuvinte, avem incredere de 98% ca adevarata medie a VEMS pentru 
sportivi sa fie intre 4,77 §i 4,91, ceea ce inseamna ca probabilitatea ca media VEMS la 
sportivi sa fie in afara acestui interval este sub 2%. 

B. Pentru e§antioane mici (N < 30) 

a. Distribute mediilor e§antioanelor 

Dupa cum am mai specificat anterior, distributia mediilor e§antioanelor poate fi 
considerate distributie normala numai in cazul e§antioanelor mari. in cazul 
e§antioanelor mici (considerate conventional mici daca N < 30), mediile e§antioanelor 
au o distributie “t” (sau distributie normala, insa mai turtita - figura II. 11); curba este cu 
atat mai turtita (deci mai diferita de curba Gauss) cu cat e§antionul este mai mic. 

b. Formule 

Curba de distributie “t” depinde deci de marimea e§antionului care va fi 
caracterizata printr-un parametru, notat cu v, numit “numar de grade de libertate” §i dat 
de relatia: 

v=N - 1 (II.4.3) 

Largimea intervalului in care localizam media populatiei va fi data de relatia: 

^(X-t^-S.-X+t^yS,) (11-4-4) 

Relatia (II.4.4.) este foarte asemanatoare cu (II.4.2.b) 



Figura 11.11. Distributia “t”. Valorile lui t care lasa cate 2,5% arie in fiecare parte (deci n.i. 
= 95%) sunt cu atat mai mari cu cat e§antionul este mai mic 


53 




Informatica Medicala & Biostatistica 


Din tabelul II.4. se poate observa apropierea lui t de z pe masura ce create 
dimensiunea e§antionului. 


Tabel II.4. Valorile lui t pentru cateva nivele de incredere (1-a) $i grade de libertate (v) 


1-a 

V 

0.90 

0.95 

0.99 

1 

6,31 

12,7 

63,7 

2 

2,92 

4,30 

9,92 

5 

2,01 

2,57 

4,03 

10 

1,81 

2,23 

3,17 

30 

1,70 

2,04 

2,75 

cx: 

1,65 

1,96 

2,58 


c. Exemplul II.3 

Consideram din nou exemplul anterior, cu valoare medie a VEMS pe un lot de 
sportivi X = 4,84/ §i S =0, 36 /, dar sa presupunem acum ca am efectuat determinarile 
pe un lot de numai N = 16 sportivi. Sa vedem in ce masura este influentat intervalul in 
care putem localiza media populatiei cu precizie de 98%. in primul rand: 

S- = S / *Jn = 0,36/ Vl6 = 0,09. Apoi pentru 1-oc = 98% §i v=16-l=15 grade de 
libertate gasim in tabelul distribute! t valoarea t oz/2v =2,60 deci: 

X e 4, 84 -0,09 *2, 60; 4, 84 + 0,09*2,60] 

X e (4,84 - 0,23 ; 4,84 +0, 23) 

X G (4,60 ; 5,08). 

Observam ca pierderea de precizie in localizare este imensa, intervalul fiind de 
peste 3 ori mai larg comparativ cu localizarea obtinuta pe un e§antion mare. 

De aceea, dupa cum vom vedea chiar in incheierea acestui subiect, in 
biostatistica putem calcula o dimensiune minima a e§antionilui pentru a putea obtine 
localizari ale marimilor estimate in intervale suficient de inguste §i cu nivel de incredere 
satisfacator de ridicat. 

4.3. Estimarea procentelor 

a. Distribute procentului in e$antion 

In cazul variabilelor calitative (nominale), indivizii dintr-un e§antion sunt grupati 
in clase; distributia de acest gen se nume§te distribute binominala. in cazul unei 
populatii avem deci cate un procent real 7ij pentru fiecare clasa i: 

1 2 ... i ... k 

Tli 7T 2 ... TCi ... 71 k (II.4.5) 

La extragerea unui e§antion din populate vom obtine procentele p v p 2 ,....,p k , cu 
deviatiile standard ale procentelor date de relatia: 


p(X-p) 


N 


(II.4.6) 
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Daca repetam extragerea e§antionului, fiecare procent pi va prezenta variatii. 
Pentru e§antioane mari procentele prezinta o repartitie normala (pentru procente nici nu 
se poate lucra pe e§antioane mici!). 

b. Formule 

Vom putea deci aplica “scorul Z”, la fel ca in cazul mediilor, deci: 

Pi e i >, ~ Z x/2 ■ S pi ; p, + Z x/2 ■ S pi (II.4.7) 


c. Exemplul II.3 

Dintr-un lot de 80 de indivizi, 24 au grupa sanguina A. Care este proportia reala 
a grupei sanguine A in populatia studiata cu nivel de incredere de 95%. 


100-24 

80 


: 30% 


= 


0.3 * 0.7 


80 


= 0.0512 = 5.12% 


p<E (30- 1.96*5.12; 30+ 1.96*5.12) sau 
p e (30 - 10, 30 + 10), adica p e (20% ; 40%) 

Cu alte cuvinte, din studiul efectuat putem face doar afirmatia ca procentul de 
raspandire al grupei A este intre 20% §i 40%, cu nivel de incredere de 95%. 

Daca aceea§i proportie, de 30% o gaseam pe un lot de 800 de indivizi (240 din 

800), obtineam S p = 1.62% §i p e (26,8%; 33,2%). 


4.4. Estimarea diferentelor 

in numeroase studii urmarim nu atat valorile absolute ale unor parametri, care au 
impra§tieri naturale destul de largi, ci in special variatiile marimilor. Aceste variatii pot 
fi urmarite atat pentru valorile propri-zise (medii ale e§antioanelor), cat §i pentru 
proportiile din e§antioane ce apartin unei clase. 


A. Diferente intre medii 
a. Pentru loturi diferite 

Exemplu II.4. care este diferenta de inaltime intre baietii §i fetele de 1 0 ani? 

Evident, raspunsul se da dupa un studiu in care obtinem, pe doua loturi, valori de genul: 
n B = 25, X B = 137,2 cm, S B = 5,1 cm 
n F = 25, X F = 138,6 cm, S F = 5,1 cm 
Estimarea diferentei se face prin: 

d- B =X B -X F = -1,4 cm (II.4.8.) 

Intervalul de incredere se apreciaza cu ajutorul deviatiei standard estimate prin 
diferente: 



pentru loturi mari ( fl 1 2 ) 30) incadrarea o vom face dupa 
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d- x _- X2 e(d - Z x/2 ■ S d ; d + Z x/2 • S d ) (D.4. lO.a) 

pentru loturi mici ( n i 2 (30) 

K-* e( d- t«*.v -s d ;d+ t^, v ■ S d ) (IIAlO.b) 

b. Pentru serii perechi 

Vom considera in continuare un caz aparte, intalnit destul de des. Sa incepem cu 
un exemplu. 

Exemplul II.5. Un medicament antihipertensiv poate fi testat fie considerand 
doua loturi - unul tratat §i unul martor - fie lucrand pe un singur lot §i facand un set de 
masuratori ale tensiunii arteriale inainte de tratament, respectiv dupa tratament. Este 
perferata ultima varianta. in acest caz vom avea, pentru fiecare individ i din lot efectul 
exprimat sub forma de diferenta dintre doua valori: 

d t = X 2l -X u ’ (II.4.11.) 

unde X 2i este valoarea dupa tratament iar X u este valoarea inainte de tratament. 

Eroarea standard a diferentelor este data de relatia: 

c = (II.4.12.) 

d V n(n-l) 

Estimarea diferentei pentru serii perechi va fi data tot de relatiile (IIAlO.a) sau 
(II.4. lO.b). 


B. Diferente intre procente 

Asemanator cu rationamentele deja prezentate pana acum, putem incadra §i 
estimarea diferentei a doua procente: 

d p =p 2 ’-Pi (11-4.13.) 

Pentru eroarea standard a diferentei a doua procente folosim formula: 




pd 


PiO-A) | PtX^ZIiI 

n l - 1 n 2 - 1 


Intervalul de incredere al estimarii va fi: 


(II.4.14.) 


d p e(d- Z a/2 • S pd ; d + Z a/2 • S pd ) (0.4.15.) 

4.5. Calculul marimii esamionului 

Cea mai importanta consecinta a studiilor privind incadrarea unui parametru intr- 
un interval este calculul marimii e§antionului. Am vazut ca largimea intervalului in care 
incadram estimatia depinde puternic de dimensiunea e§antionului (n). Aceasta 
dependenta ne poate folosi la evaluarea marimii e§antionului astfel incat sa obtinem 
incadrarea parametrului populatiei intr-un interval rezonabil de ingust. 

Exemplul II.6. Dorim sa determinam inaltimea medie a copiilor de 10 ani cu 
precizie de ± 1 cm , avand un nivel de incredere de cel putin 95%. Ce dimensiune 
minima trebuie sa aiba e§antionul? 


56 




D. Lungeanu, Gh.-I. Mihala§ 


Conform relatiei (II.4.2.b) vom avea: 

Z a/2 S x = 1,96 • S- = 1 cm, adica: S- = 1/1,96 = 0,5 cm. 

Pentru calculul lui n ar trebui cunoscut gradul de impra§tiere a valorilor 
inaltimii pentru populatie, exprimat prin deviatia standard a populatiei <j ; de obicei 
acesta marime nu este cunoscuta §i in locul ei se folose§te o estimare a deviatiei 
standard S obtinuta intr-un studiu pe un e§antion. in cazul exemplului nostru, 
considerand ca intr-un studiu anterior s-a gasit S = 6 cm, din relatia (5.8.b) obtinem: 

n = (S/S x ) 2 (II.4.16) 

in care inlocuind valorile din exemplu 

n = (6/0,5) 2 =144. 

Deseori nici s nu este cunoscut §i atunci fie facem un studiu preliminar fie il 
aproximam pe s cu relatia: 

S = (X max -xJ in )/6 (II.4.17) 

in care X min §i X max reprezinta valorile extreme la care ne-am a§tepta, evaluate conform 
experientelor noastre anterioare. 


5. TESTE STATISTICE 

5.1. Notiuni generale 

A. Diferente semnificative §i nesemnificative din punct de vedere statistic 

in exemplul nostru cu inaltimea copiilor nu am facut pana acum distinctie intre 
baieti §i fete. Un studiu asupra dezvoltarii copiilor ar trebui sa tina cont de evolutia 
hormonala diferita care va genera dezvoltarea somatica diferita. Vom dezvolta exemplul 
nostru astfel: 

Exemplul II.7. Pe un lot de 36 de baieti de 10 ani obtinem pentru inaltime 
urmatoarele rezultate: n B = 36 , x B = 137cm, S B =12 cm, deci S^= 2 cm, iar pe un grup 
de 36 fete de aceea§i varsta: n F = 36, X F = 140cm, S F =12 cm, deci Sf = 2 cm. 

Intrebare: diferentele observate arata ca fetele de 10 ani sunt mai inalte decat baietii sau 
pot sa fie atribuite intamplarii? 

Sa remarcam mai intai ca diferentele observate in cursul unor studii pot fi 
clasificate in doua categorii: 

1. - diferente ce pot fi atribuite intamplarii (variabilitatii de e§antionare); 
acestea vor fi numite diferente nesemnificative 

2. - diferente ce pot avea alte cauze numite diferente semnificative. 

Sa analizam datele de mai sus: pentru un nivel de incredere de 95%, Z 0 ^5 = 2,02 
&2 deci ju B e (133,141 ), cu alte cuvinte avem probabilitatea de 95% ca media unui alt 
e§antion, extras din aceea§i populatie (de baieti) sa se gaseasca in intervalul 133 - 141 
cm. Faptul ca pentru un e§antion, cum ar fi grupul de fete, am gasit media 140 s-ar 
putea datora deci, in mare masura, intamplarii. Accentuam exprimarea “in mare 
masura”, fiindca aici apare un arbitrar; noi am apreciat intervalul (133; 141) 
considerand un nivel de incredere conventional de 95%. Acceptand aceasta conventie 
ajungem la concluzia ca, daca media inaltimii fetelor este de 140, acest lucru nu ne 
indreptate§te sa afirmam ca fetele sunt mai inalte fiindca sunt §anse mari ca diferente de 
acest gen sa apara din intamplare. in schimb, daca obtinem pentru fete inaltimea medie 
Xp =142 cm, aceasta valoare cadea in afara intervalului (133 ; 141); probabilitatea ca 
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sa obtinem din intamplare media unui e§antion in afara acestui interval este sub 5%; in 
acest caz noi vom considera ca nu din intamplare s-a obtinut aceasta valoare §i ca 
diferentele sunt semnificative (fig. 11.12). 

Sa facem doua observatii importante: 

1. - pragul de 5% pe care 1-am folosit in exemplul nostru pentru a decide daca 
diferentele vor fi considerate semnificative sau nesemnificative este conventional; el se 
nume§te prag de semnificatie §i este considerat 5% in majoritatea cazurilor; 

2. - concluziile au un caracter pur probabilist; daca obtinem X F §i spunem ca 
fetele sunt mai inalte, sa nu uitam ca exista o anumita probabilitate, chiar daca este mica 
(sub 5%) ca sa fi obtinut asemenea valori din intamplare, adica in realitate sa nu avem 
diferente semnificative. 

De asemenea faptul ca pentru cazul X F = 140 spunem ca diferentele de inaltime 
intre baieti §i fete nu sunt semnificative din punct de vedere statistic nu insemna ca in 
realitate nu avem diferente semnificative - numai faptul ca din masuratorile efectuate 
nu putem afirma ca ar fi “statistic semnificative”. 

De aceea in analiza statistic^ pe care o efectuam cand aplicam testele statistice 
pomim cu formularea unei ipoteze, pe care o vom accepta sau respinge cu o anumita 
probabilitate. 

5.2. Ipoteze statistice 

Testele statistice prin care se realizeaza o comparatie incep cu enuntarea unei 
ipoteze privind un rezultat posibil al compartiei, numita ipoteza statistic^, pe care o 
putem defini astfel: 

Definitie: Ipoteza statistic^ este o propozitie continand o afirmatie sau 

negatie privind un parametru al unei populatii sau o lege de distribute. 

Ipotezele au diferite variante de formulari, de aceea le vom defini la inceput in 
cazuri nu foarte generale. 



Diferente nesemnificative 



Figura 11.12. Ilustrarea diferentelor nesemnificative §i semnificative din exemplul II. 7 


A. Ipoteza de zero 

Ipoteza de zero face intodeauna afirmatia ca “intre elementele pe care le 
comparam nu exista diferente semnificative”. 
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Ipoteza de zero se noteaza prescurtat de obicei cu H 0 §i se mai nume§te ipoteza 
de nul sau ipoteza nula (impropriu). 

Exemplu: in cazul in care comparam inaltimea medie a baietilor §i fetelor, 
ipoteza de zero s-ar scrie: 

H 0 :X b =X f (II.5.1) 

Alte enunturi echivalente: 

- “diferentele observate se datoresc numai intamplarii” 

- “nu putem afirma ca intre cele doua valori (serii, distributii) exista diferente 
semnificative”. 

Prin ipoteza de zero putem compara: 

- o valoare medie (obtinuta pe un lot) cu valoare data (numar) 

- doua valori medii (doua loturi) - cel mai adesea 

- o distribute experimentala cu una teoretica 

- doua distributii experimentale 

- doua dispersii 

- mai multe valori medii 

- mai multe dispersii, etc., etc. 

B. Ipoteze alternative 

Propozitiile care sunt adevarate cand/ daca H 0 nu este adevarata se numesc 
ipoteze alternative §i se noteaza cu H a sau H h 

Ipotezele alternative se pot cel mai simplu exemplifica in cazul compararii a 
doua valori medii ^ B \ X F . Vom putea avea situatiile: 

a. X B ^ X F (“inaltimea baietilor este diferita de a fetelor”) 

b. X B ) X F (“baietii sunt mai inalti decat fetele”) 

c. X B (X F (“fetele sunt mai inalte decat baietii). 

Ipoteza alternativa (a) se nume§te bilaterala (este adevarata atat cand X B ) X F 
cat §i cand X B (X F ), in timp ce variantele (b) §i (c) se numesc unilaterale. 

C. Prag de semnificatie 

Am vazut ca pentru a putea stabili daca diferentele sunt semnificative sau nu, 
trebuie sa ne alegem arbitrar un prag al probabilitatii, numit prag de semnificatie, a, cu 
ajutorul caruia stabilim latimea intervalului in care consideram ca avem fluctuatiile, 
datorate intamplarii (atribuite variabilitatii de e§antionare); daca valoarea de comparat 
va fi inclusa in acest interval vom spune ca diferentele sunt ne semnificative §i vom 
accepta ipoteza de zero. De aceea acest interval se mai nume§te regiune de acceptare; 
limitele intervalului se numesc valori critice, iar regiunea exterioara se nume§te 
regiune de respingere sau regiune critica (fig. 11.13). 

Pragul de semnificatie a are o valoare arbitrara. Alegerea lui trebuie sa 
satisfaca doua conditii: 

- pe de o parte valoarea trebuie sa fie suficient de mica pentru ca probabilitatea 
ca din intamplare sa obtinem diferente la fel de mari sa fie redusa 

- pe de alta parte alegerea unei valori prea mici large§te prea mult regiunea de 
acceptare, deci a trebuie sa fie suficient de mare pentru a mentine intervalul destul de 
ingust. 
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Conventional se accepta ca, in majoritatea studiilor in medicina §i biologie, este 
satisfacatoare valoarea a =0,05. 

D. Nivel de incredere 

Valoarea 1 - a se nume§te nivel de incredere §i se exprima de obicei in procente. 
Deci pentru valoarea uzuala a = 0.05 nivelul de incredere este de 95%. Cu alte 
cuvinte, in acest caz avem o incredere de 95% (probabilitate de 95%) ca decizia pe care 
o luam prin aplicarea testului sa fie corecta. 

5.3. Etapele aplicarii testului statistic 

Dupa ce am defmit principalele marimi folosite pentru aplicarea unui test 
statistic putem sistematiza etapele de lucru: 

A. Defmirea marimilor de comparat - evident, trebuie precizat la inceputul 
studiului care vor fi marimile asupra carora se indreapta atentia §i asupra carora se vor 
aplica testele. in functie de acestea vom alege diferite tipuri de teste. 

B. Formularea ipotezei zero §i a celei alternative - operatie primara, fiindca 
rezultatul testului (decizia) se exprima in functie de H 0 : se accepta sau se respinge. Daca 
nu se urmare§te in mod special o ipoteza alternative Hi B sau H 1C , se accepta ca ipoteza 
alternative cea bilaterale Hi A . 

C. Alegerea pragului de semnificatie al testului - in majoritatea cazurilor se ia a 
= 0,05 care confera un nivel de incredere de 95%. 


Valori critice absolute 


X B 

valori absolute serii 

133 

Regiunea de respingere 
a ipotezei de zero 
(se accepta ip. altem.) 

Diferente Semnifrcative 

- 4 

137 

Regiunea de 

a ipotezei < 

(Diferente N< 

daca X- 
F 

0 

141 

i acceptare 
ie zero 

3s emnific ative 

, cade aici) 

+ 4 

maltimea x 

Regiune de respingere 
a ipotezei de zero 
(se accepta ip oteze altem.) 

Diferente s emnific ative 

D = X - X B 

Vi-X E 

- 2 

ii 

# 

al 

° i)lL 

+ 2 

Tvvalori absolute diferente intre 
Xg 

seru 

valori relative fata de 

r i = R i - 

1 1 

's* d = E 

1 1 

r,=H; 

1 

/S x = Z a/2 d = D/S x 

1 


Figura 11.13. Regiunea de acceptare §i H 0 exprimata cu valori absolute ale seriilor §i 
diferentelor §i cu valori relative, pe scara normalizata fata de ■ In aceste exemple s-a 
utilizat pragul de semnificatie a = 0,05. 

D. Alegerea testului - este etapa esentiala careia ii vom dedica un paragraf 
separat; in functie de tipul de variabile §i modul de distribute al valorilor se alege testul 
cel mai potrivit in functie de care se efectueaza calculele (etapele E §i F). 

E. Calculul valorilor critice (de obicei cele relative) §i stabilirea regiunilor de 
acceptare / respingere a ipotezei zero. 

F. Calculul coeficientului p care reprezinta probabilitatea ca: 

- ipoteza de zero sa fie adevarata, sau 

- diferentele sa fie nesemnificative, sau 

- sa ne incadram in regiunea de acceptare. 
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Etapele E si F nu sunt distincte din punct de vedere al calculelor. 

G. Formularea deciziei - etapa finala, in functie de p: 

- daca p > a acceptam H 0 §i spunem ca diferentele sunt nesemnificative 

- daca p < arespingem H 0 §i spunem ca diferentele sunt semnificative. 

Pentru a =0,05 regiunea de respingere sew imparte la randul ei in 3 subregiuni 
in care se incearca o gradare a diferentelor semnificative (fig. 11.14). 

in toate cazurile in care diferentele sunt semnificative ipoteza de zero H 0 se 
respinge. 

Observatie: Statistic semnificativ nu inseamna §i important din punct de vedere bio- 
medical. 


p 

p > 0.05 Dif NESEMNIFICATTVE 

Acceptam H 0 

0.05 — 5 

p < 0.05 Dif SEMNIFICATIVE 


0.01 = 1 % 

p < 0.01 Dif FOAEIE Semnificative 

Eespingem H Q 

0.001=0.1% 

p < 0.001 Dif EXTREM de semnific. 





Figura 11.14. Formularea deciziei unui test statistic in functie de valoarea lui p 


5.4. Erori 

Este foarte important sa nu pierdem din vedere faptul ca decizia unui test 
statistic are caracter probabilistic. Deci faptul ca in cazul X B = 137 cm X F — 140cm 

am obtinut p>0,05 §i am acceptat H 0 afirmand ca diferentele sunt nesemnificative nu 
inseamna ca in realitate nu avem diferente de inaltime intre baieti §i fete la 10 ani ci 
doar faptul ca, din studiul efectuat de noi, probabilitatea ca fetele §i baietii sa aiba 
aceea§i inaltime este mai mare decat 5%, ceea ce nu ne permite sa afirmam ca 
diferentele sunt semnificative §i deci le-am putea atribui intamplarii (variabilitatii de 
e§antionare). S-ar putea ca in realitate diferentele sa fie semnificative dar din diverse 
motive (fie pura intamplare, fie loturi prea mici - din care cauza se obtine o valoare 
mare pentru S'- ) aceste diferente n-au fost sesizate ca atare. Exista deci riscul de a 

avea erori in decizia noastra. 

Erorile statistice posibile se impart in doua clase: 

a. erori de tip I : cand respingeam H 0 de§i este adevarata 

b. erori de tip II: cand acceptam H 0 de§i este falsa. 

Probabilitatea erorii de tip I se noteaza cu a (este de fapt chiar legata de pragul 
de semnificatie), iar cea a erorii de tip II cu J3. 

Situatiile posibile de decizie sunt sintetizate in tabelul II.5.1. 
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Tabelul II. 5. Situatii posible in decizia testelor statistice 


SITUATIA 


H 0 = Adevarata 


Corect 

p=l-a 


Eroare tip I 
p = a 


Acceptam H 0 


Respingem H 0 



Corect 

p = i-p 


Observatie : Denumirea de “erori de tip I §i II” este din ce in ce mai des intocmita cu cea 
de “rise de (eroare de) tip I sau II”; valorile a §i |3 arata doar “probabilitatea de a le 
comite”. 


5.5. Caracteristicile testelor statistice 

A. Nivelul de incredere 

Definitie: Marimea 1-a se nume§te “nivel de incredere” sau “nivel de confidenta” 
(uneori simplu “increderea” sau “confidenta”) testului; a reprezinta pragul de 
semnificatie, sau probabilitatea erorii de tip I §i reprezinta capacitatea de a accepta o 
ipoteza cand aceasta este adevarata. 

B. Puterea testului 

Definitie: Marimea 1 - (3 se nume§te “puterea testului”, unde (3 reprezinta probabilitatea 
erorii de tip II §i reprezinta capacitatea de a respinge o ipoteza cand aceasta este falsa. 

Cele doua caracteristici, nivelul de incredere §i puterea testului se afla in relatie 
de inversa proportionalitate. intr-adevar, daca am dori sa cre§tem nivelul de incredere al 
testului, 1 - a, ar trebui mic§orat pragul a, de exemplu de la 5% la 1%, in acest caz 
intervalul in care vom incadra media unui e§antion extras din aceea§i populatie va fi 
mai larg (Z 0t99 & 2,33 fata de Z 0j95 & 1,96) deci suntem mai increzatori ca, daca este 
adevarat ca cele doua medii nu sunt semnificativ diferite (chiar daca din intamplare a 
aparut o diferenta putin mai mare), acesta nu va afecta decizia. Deci scade 
probabilitatea erorii de tip I. 



Figura 11.15. Ilustrarea caracteristicilor unui test. In acest exemplu, valorile medii pentru 
populatii sunt ju B =137 cm, ju F =142 cm. Luand referinta lotul de baieti, pentru a = 5% 
intevalul de acceptare este (133,141). Fata de limita 141 avem probabilitatea de cca 30% de 

a gasi X F < 141 dar §i p « 2,5% pentru a gasi X B >141. 
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in schimb, dacS in realitate diferentele sunt statistic semnificative, aceastS ISrgire a 
intervalului ne poate conduce la concluzia falsa cS diferentele sunt nesemnificative, in 
timp ce ele in realitate sunt! Deci create probabilitatea erorii de tip II. 

Relatia intre nivelul de incredere §i puterea testului poate fi ilustratS ca in figura 
11.15; construitS pe baza datelor din exemplul folosit anterior. 

5.6. Teste parametrice §i neparametrice 

Stabilirea regiunii de acceptare este evident dependents de tipul de distribute a 
valorilor (in exemplele discutate panS acum s-a considerat ca indeplinitS distributia 
normala). insS exists situatii in care nu cunoa§tem tipul de distribute, astfel incat nu 
mai putem calcula atat de simplu regiunea de acceptare. in functie de acest aspect 
putem impSrti testele in douS categorii: 

a. teste parametrice - in care distributia este cunoscutS (cel mai adesea se 
considers doar distributia normals, pentru care se pot aplica aceste teste), 

b. teste neparametrice - in care se considers necunoscutS distributia; testele 
neparametrice sunt mai generale; dacS distributia este in realitate o distribute normals 
testele neparametrice dau - in majoritatea cazurilor - rezultate asemSnStoare cu cele 
parametrice; de aceea, in ultimul timp, ele se folosesc din ce in ce mai mult. 

5.7. Clasificarea testelor statistice 

in functie de mSrimile comparate putem distinge mai multe clase de teste 
statistice: 

A. Teste de semnificatie - prin care se verifies egalitatea unui parametru estimat 
(medie, procent, etc.) cu o valoare datS. 

B. Teste de omogenitate - prin care se comparS doi parametri (medii, procente, 
dispersii etc.). 

Observatie: in unele manuale sunt considerate teste de omogenitate numai cele 
de comparatie a parametrilor de dispersie (deviatii standard etc.), iar pentru compararea 
a douS medii sau proportii se utilizeazS termenul de “teste de semnificatie”. 

C. Teste de concordanta - prin care se comparS o distribute experimentalS cu 
una teoreticS sau se comparS douS distributii experimentale. 

D. Teste de independents - prin care se verifies independenta unor serii de 
valori experimentale (in special pentru tabele de contingents). 

E. Teste pentru corelatii - prin care se evalueazS semnificatia parametrilor 
estimati in analiza corelatiei. 

Observatie: Unii autori includ aceste teste in categoria testelor de semnificatie. 

Din punct de vedere teoretic se pot compara statistic §i alte elemente, specifice 
unui anumit domeniu (ex.: in analiza semnalelor biologice) pe care le vom prezenta in 
contextul corespunzStor. 

5.8. Teste uzuale in biostatistica 

in paragraful care urmeazS vom descrie cele mai importante teste folosite in 
biostatisticS pe care le vom prezenta pornind de la mSrimile care se comparS. 

A. Se comparS o valoare medie cu o valoare data 

. Ipoteza de zero: X = X 0 
. Test aplicat: 

a. testul Z - dacS n >30 

b. testul t - dacS n < 30 
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Observatie: Denumirea de “testul Z” nu este folosita prea des deoarece distributia 
normala Z este un caz limita al distributiei t, cand numarul gradelor de libertate este 
foarte mare. Denumirea uzuala pentru testul aplicat in aceste conditii va fi “testul t 
pentru o serie” 

Observatie: daca cr m (eroarea standard a populatiei) este cunoscuta, se folose§te ea in 
calculul intervalului de acceptare (vezi formula 4.2.b. sau 4.4); daca nu este cunoscuta, 
se folose§te estimatorul ei, S ^ (formula 5.8.b). 

Exemplu II.8 intr-un raport se sustine ca inaltimea medie a copiilor de 10 ani este 139 
cm. Acceptam aceasta afirmatie? 

Rezolvare: luam un lot avand n = 36 copii pe care obtinem X -137,3 cm, S = 
9 cm. 

. Ipoteza de zero: H 0 : 137,3 = 139 cm 

. Alegem pragul de semnificatie a = 5%; atunci Z a = 1,96 &2 
. Pentru lotul nostru = 9 / V36 = 1,5 cm 
. Intervalul de acceptare este: 

- in valori absolute : (137,3 - 1,96 . 1,5 ; 137,3 + 1,96 . 1,5) adica (137,3 - 3; 
137,3 + 3), sau (134,3 - 140,3); valoarea X 0 = 139 se gase§te in acest interval, deci 
acceptam H 0 §i spunem ca diferentele observate (intre media experimentala 137,3 §i 
valoarea ipotetica 139) sunt nesemnificative §i se datoresc intamplarii. 

- in valori absolute ale diferentelor: 

D = X 0 - X = 139-137,3 = 1,7 cm 

intervalul fiind (-1,96*1,5 ; + 1,96* 1,5) adica (-3, +3) 

Valoarea 1,7 este in acest interval, deci acceptam H 0 

- in valori relative: 

d = D/S^ =1,771,5 *1,13 

intervalul fiind (-1,96; +1,96) 

Valoarea 1,13 fiind in acest interval, acceptam H 0 . 

B. Se compara doua valori medii 
. Ipoteza de zero: H {) \ X ] = X 2 
. Conditii: Sj - S 2 ; sepoate N { ^ N 2 

. Grade de libertate: v = Nj + N 2 - 2 
. Test aplicat: 

a) Parametric: testul t nepereche (testul Student) 

b) Neparametric: testul Mann - Whitney 

in continuare prezentam doua variante de rationament: 

Varianta I 

Exemplu II. 9. Se analizeaza capacitatea vitala a unui grup de sportivi comparativ cu un 
grup de control, obtinand: 

. lot sportivi: Nj = 36, X { = 5,39 l , S { = 0,60 l 
. lot martor: N 2 = 50, X 2 = 4,83 l, S 2 = 0,701 
Ipoteza de zero: H 0 : 5,39 (±0,6) = 4,83(30,7) 

Alegem pragul de semnificatie: a = 5%. 
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Numarul gradelor de libertate: v = 36 + 50 - 2 = 84 

Din tabelul cu valorile distributiei t, observam ca pentru valori intre 60 §i 120 
grade de libertate, coeficientul de incredere va fi acela§i. Deci, pentru un test bilateral 
(i two-tailed ), gasim f 0 , 975^0 = 2.00 • Fiind o valoare din tabel, o vom nota in continuare 

cuindicele “t” deci t t =2.00. 

Calculam eroarea standard pentru diferente: 


c 2 9 2 


S d - j— — + — — — = Vo!o2 = 0,14 
d M 36 50 

Deci intervalul de acceptare a diferentelor este: 


(115.2) 


d E (—t t • S d M t 'S d ), adica: (II.5.3.) 

d g <-2*0.14; + 2*0.14^sau d e <-0.28;0.28^ 

Diferenta obtinuta este: 

J = Xj — X 2 =0.56 (II. 5.4.) 

deci este situata in afara regiunii de acceptare §i noi vom respinge H 0 , considerand 
adevarata ipoteza alternativa §i vom spune ca diferentele sunt semnificative. 

Pentru a vedea eventual §i “cat de semnificative” sunt aceste diferente, putem 
calcula regiunile de acceptare pentru: 

. foarte semnificative: t t = t 099 . 60 = 2,66; d e (- 0 , 37 ;+ 0 , 37 ) 

. extrem de semnificative: t t = t 0999 . 60 = 3 , 37 ; d e (- 0 , 47 ;+ 0 , 47 ) 

Observam ca diferenta reala d = 0,56 este in afara atat a intervalului de acceptare 
pentru probabilitatile de 1% cat §i 0,1% deci vom considera ca diferentele sunt “extrem 
de semnificative”, probabilitatea ca din intamplare sa obtinem din aceea§i populatie 
doua loturi atat de diferite fiind sub 0,1%. 


Varianta II 

Rationamentul expus mai sus este u§or de inteles, fiind calculate intervalele de 
acceptare pentru 3 probabilitati: 5%, 1% §i 0,1% §i urmarind incadrarea diferentei 
reale. in pachetele software de prelucrari statistice se procedeaza invers: se calculeaza 
direct probabilitatea de a obtine asemenea diferente din intamplare. 

Se calculeaza mai intai valoarea lui t care corespunde diferentei reale: 

d Z-X 2 

t c= — = — 1 

s d S d 

( 11 . 5 . 5 .) 

adica: 


t e 


0,56 

0,14 


4.00 


Din tabelul valorilor distributiei t, pentru 60 grade libertate (urmarim linia lui 
60), vedem ca t c > t 0 , 999 : 60 ; programele statistice ne dau valoarea pentru care: 
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t c = (II.5.6.) 

§i afi§eaza valoarea lui p, pe care o vom interpreta conform fig.II. 14. in exemplul 
nostru obtinem p = 0,00087 , deci avand p <0,001 vom spune ca diferentele sunt “extrem 
de semnificative”. 

Testul Mann-Whitney este echivalentul neparametric al testului t nepereche. Ca 
rationament este similar cu testul Wilcoxon §i va fi exemplificat acolo. Pentru loturi mai 
mari, rezultatul obtinut este acela§i ca in cazul aplicarii testului t. Pachetele software de 
prelucrari statistice dau valoarea lui p (adica probabilitatea ca diferentele observate in 
e§antionul de valori sa fi aparut din intamplare, in conditiile in care indivizii observati 
ar face pate dintr-o aceea§i populatie statistical Interpretarea o facem tot conform fig. 
11.14. 


C. Se compara doua valori medii, din doua serii obtinute pe aceia§i indivizi, 
in doua conditii diferite 
. Ipoteza zero: H 0 :X ] = X 2 

. Conditii: valori perechi - X u , X i2 reprezinta valorile obtinute pe individul i 
in conditiile “1” respectiv “2”. 

intotdeauna: = N 2 = N 

Grade de libertate: v = N - 1 

. Test aplicat: testul t pereche 

Observatii: testul t pereche este de fapt un test t pentru o serie aplicata 
diferentelor; acest lucru este vizibil daca sistematizam datele conform tabelului II. 6. 


Tabel II. 6. Prezentarea datelor pentru testul t pereche 


Individ 

Valori experimentale 
Conditia 1 

Conditia 2 

Diferente 

Di =Xa-X u 

1 

X n 

X 12 

D, 

2 

X 2 i 

X 22 

d 2 

i 

X u 

X, 2 

Dt 

N 

X m 

X N2 

d n 

Medii 

X 

x 2 

D 


Valorile di pot fi pozitive sau negative; daca intre cele doua serii nu sunt diferente vom 
avea D =0. Ipoteza de zero de mai poate deci scrie: 

H 0 :D = 0 

Exemplu II. 10. Dorim sa studiem efectul unui medicament asupra frecventei cardiace. 
Pe un lot de N = 9 indivizi obtinem valorile din tabelul II. 7 
Efectuand calculele, obtinem: 

D = +4, S = 4,5 , S- =1,5 

Pentru v = 8 §i a = 5%, t t =2,3 deci regiunea de acceptare va fi: 

(- t t • Sj,+t t -S d ) = (-2,3 . 1,5 , + 2,3 . 1,5) = (-3,45, + 3.45) 
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deci valoarea obtinuta D de gase§te inafara intervalului de acceptare §i vom spune ca 
diferentele sunt semnificative, probabilitatea ca din intamplare sa obtinem diferentele 
din tabelul 11.53. fiind sub 5%. 


Tabel II. 7. Frecventa cardiaca inainte si dupa tratament 


Subiect 

FC inainte 

FC dupa 

Diferenta 

1 

63 

73 

+10 

2 

67 

67 

0 

3 

79 

76 

-3 

4 

67 

75 

8 

5 

68 

70 

2 

6 

72 

71 

-1 

7 

73 

80 

7 

8 

69 

76 

7 

9 

70 

75 

5 


Introducand datele din tabelul 11.53. intr-un program de calculator obtinem 
p = 0,042, adica p < 0,05 , deci cu aceea§i interpretare. 

D. Se compara doua mediane sau doua serii ordinale. 

. Ipoteza de zero se va referi la mediana ca indicator al tendintei centrale. 

. Test aplicat: testul Wilcoxon - aplicat in doua versiuni: 

- pentru serii independente : testul “suma rangurilor” ( rank-sum test) 

- pentru serii perechi: testul “semnul rangurilor” (signed-rank test ) 
a.) Testul “suma rangurilor” 

. Conditii: variabile ordinale (ranguri) sau variabile numerice aduse sub forma 
de ranguri (in acesta situatie el este identic cu testul neparametric Mann - Whitney) 

. Grade de libertate: valorile din tabel sunt dependente de ambele dimensiuni 

N x §i N 2 ; de aceea de accepta sa se ia conventional cea mai mica serie ca prima ( 

N, <N 2 ) 

. Fundamentare teoretica: 

Fie doua serii de valori ale unei variabile ordinale, obtinuta pe doua loturi 1 §i 2 
pe care le ordonam astfel: 

- seria 1, cu N { indivizi: X x < X 2 < < X { < < X Nl 

- seria 2, cu N 2 indivizi: Y X <Y 2 < < Y. < < Y N2 

Seriile 1 §i 2 le luam astfel incat N x < N 2 . 

Se alcatuie§te lotul compus din amestecarea celor doua loturi, avand N = N1 + 

N2 indivizi §i se ordoneaza incat: Z x < Z 2 < < Z k < Z N , unde Z este o valoare 

X sau Y. Acestui §ir i se asociaza un §ir de ranguri r k cu valori intre 1 §i N; daca doua 
sau mai multe valori succesive in §irul Z sunt egale (de exemplu Z 2 = Z 3 = Z 4 ), acestor 
ranguri li se asociaza o valoare intermediara calculate ca medie intre rangul maxim §i 
cel minim din acel grup de ranguri (in exemplul nostru r 2 = r 3 = r 4 = 3. ) Sa notam deci 

rangurile cu: r x < r 2 <....< r k <....< r N §i notam suma rangurilor ce corespund valorilor 
din primul lot cu Ri , respectiv din al doilea lot cu R 2 . Pentru aplicarea testului se 
calculeaza doua statistici: 
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[/, =N 1 N 2 + N l (N 1 + 1) / 2 - (II. 5.7. a) 

U 2 = N { N 2 + N 2 (N 2 + 1) / 2 - (II.5.7.b) 

?i se ia U = min ([/,,I/ 2 ). (II.5.7.C) 

Daca /V, si sunt mari (> 10), statistica U are o distribute aproximativ 
normala cu media: 

Mu =N r N 2 /2 (II.5.8) 

§i deviatia standard: 

< t u =V n , n 2 (N 1+ N 2+ 1)/12 (II.5.9.a) 


Pentru e§antioane mai mici s-au realizat tabele speciale pentru testul Wilcoxon 
rank- sum ce contin probabilitatea de a obtine valori U in anumite inervale. 

Cel mai des, din tabele se apreciaza intervalul ce cuprinde regiunea de acceptare 
a ipotezei de zero cu o anumita probabilitate, adica regiunea de incadrare a valorii 
care are o repartitie cu media: 

N l (N l +N 2 + \)I2 (II. 5. 10) 

§i deviatia standard 

S v = ^^(^+^2 + 1)/ 12 (II.5.9.b) 

Pentru un test bilateral cu a = 5%, se cauta in tabele valorile pentru Ri (0,025) §i 
R 2 (0,975). 

Pachetele software de prelucrari statistice ne dau direct valoarea probabilitatii p 
interpretabila conform fig. 11.14. 

Exemplu 11 . 11 . Se analizeaza aprecierea subiectiva a gradului de adaptare la efort al 
unui lot de sportivi comparativ cu un lot martor. Pentru aprecierea adaptarii se folose§te 
scara Borg a senzatiei subiective de efort, care asociaza valori de la 0 la 20, aproximativ 
dupa tabelul 11.54. 

Tabelul I I. 8. Scara Borg a senzatiei subjective la efort (su mar) 


Valoare 

Aprecierea efortului 

0 

Extrem de u§or 

5 

Relativ u§or 

10 

Mediu 

15 

Destul de greu 

20 

Epuizant 


Ambele loturi sunt supuse la un efort standard: 5 minute, 45 W efort 
triunghiular, pe bicicleta ergometrica. Un model de rezultate este prezentat in tabelul 


II.9. 
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Tabelul 11.9. Senzatia subiectiva la efort standard pe doua loturi: lot 1 - sportivi 


Valori 

Ranguri 

Sportivi 

Martor 

Sportivi 

Martor 

2 

6 

1 

5 

5 

6 

2,5 

5 

5 

9 

2,5 

8 

6 

11 

5 

10,5 

8 

11 

7 

10,5 

10 

12 

9 

12 


14 


13 


15 


14 



R 7 =27 

R 2 =78 


U, =6-8 + 6-7/2-27 = 42 
U 2 = 6-8 + 8-9/2-78= 6 
U =6 
Mu = 24 

<t = 60 


Sirul global 

2 

5 5 6 

6 

6 

8 

9 

10 

11 

11 

12 

14 

15 

Nr. crt. 

1 

2 3 4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

Ranguri 

1 

2.5 2.5 5 

5 

5 

7 

8 

9 

10.5 

10.5 

12 

13 

14 

Lotul 

1 

1 1 ( 1 ) ( 2 ) ( 2 ) 

1 

2 

1 

2 

2 

2 

2 

2 


Deoarece in cele doua loturi sunt prea putine valori pentru ca statistica U 
calculate sa urmeze o distribute normala, vom determina nivelul de semnificatie 
utilizand tabelele speciale pentru e§antioane mici. 

Din tabelul pentru testul U se obtine, pentru un test bilateral, cu prag de 
semnificatie 

a =5% (a/2 = 0,025 §i l-a/2 = 0,975), intervalul de acceptare pentru Rj\ (29,61); 
observam ca valoarea noastra Ri = 27 este in afara intervalului de acceptare a ipotezei 
zero, deci o respingem §i vom considera ca sportivii apreciaza acela§i efort ca fiind mai 
u§or. 

b.) Testul “semnul rangurilor” 

. Conditii: serii perechi de variabile ordinale (ranguri) sau variabile numerice 
aduse sub forma de ranguri (echivalentul neparametric pentru testul t pereche). 

. Grade de libertate: N x = N 2 = N ; 

. Fundamentare teoretica: 

Fie doua serii de valori ale unei variabile ordinale, obtinute pe un lot, de volum 
N, in doua conditii, 1 §i 2. Pentru fiecare individ i obtinem diferenta D t = X 2i -X u , care 
poate fi pozitiva sau negativa. Se ignora diferentele nule. 

intr-o prima faza neglijam semnele §i ordonam crescator valorile absolute ale 
diferentelor; apoi le acordam ranguri, ca in exemplul anterior. Reintroducem acum 
pentru ranguri semnele pe care le-am avut la diferentele Di §i calculam separat doua 
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totaluri: R (+) este suma rangurilor pozitive §i R(-) este suma rangurilor negative. 
Calculam acum statistica testului: 

R=R(+) (II. 5. 11) 


T = 


R 


+ 1 


/^w^W^rj24 


(II. 5.11’) 


N reprezinta numarul diferentelor D t care nu sunt zero. 

Pentru e§antioane mari (N > 16) statistica T are o repartitie normala, cu media: 


Mt = N(N + l)/4 


(II. 5. 12) 


§i deviatia standard 

o T = yjN(N + l)(2)V + l)/24 (II. 5. 13) 


Se cauta din tabel valoarea T 0 .o 25 ;io = T tab pentru a accepta H 0 

Pentru situatii in care statistica T nu urmeaza o distribute normala (numarul 
diferentelor D t care nu sunt zero N < 16), exista tabele speciale care prezinta pentru 
testul Wilcoxon signed-rank. Se poate astfel evalua intervalul de acceptare a ipotezei 
zero, pentru testele bilaterale respectiv limitele critice pentru testele unilaterale. 

Pachetele software de prelucrari statistice ne dau valoarea probabilitatii p de 
acceptare a ipotezei zero, interpretabila conform fig. 11.14. 

Exemplu 11.12. Aprecierea cuno§tintelor (aptitudinilor) prin note reprezinta variabile 
ordinale. Analizam eficienta unui curs dupa punctajul obtinut la un test de cuno§tinte 
aplicat atat inainte cat §i dupa un curs auxiliar pe acela§i grup de studenti. Rezultatul la 
un astfel de chestionar se exprima printr-un punctaj cu valori intre 0 §i 40. 

in tabelul II. 10 sunt prezentate rezultatele obtinute pe un lot de 10 studenti. 


Tabelul II. 10. Rezultatele la testul de biostatistica obtinute pe un lot de 10 studenti, inainte 
si dupa ce au urmat un curs auxiliar de teoria probabilitatilor 


Student 

Inainte 

Dupa 

Diferenta 

Rang 

1 

35 

38 

+3 

+5,5 

2 

26 

30 

+4 

+7,5 

3 

36 

36 

0 


4 

30 

35 

+5 

+9 

5 

38 

40 

+2 

+4 

6 

29 

28 

-1 

-2 

7 

21 

25 

+4 

+7,5 

8 

27 

24 

-3 

-5,5 

9 

31 

30 

-1 

-2 

10 

35 

36 

+1 

+2 


La stabilirea rangurilor se ignora diferentele cu valoare 0. 

§ir diferente absolute 01112334 4 5 

Nr. crt. ’ 123456789 

Rang 2 2 2 4 5,5 5,5 7,5 7,5 9 

R(+)=35.5 
R(-)=9.5 
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in acest exemplu nu vom putea utiliza distributia normala (sunt prea putine 
valori), ci tabelul special pentru testul Wilcoxon signed-rank. Putem alege un test 
unilateral, adica ipoteza de zero sa fie H 0 :A = 0 (in cuvinte: cursul nu a determinat 

imbunatatirea semnificativa a rezultatelor la test), avand ca alternative, in cazul 
respingerii H 0 ipoteza H x : A > 0 (adica rezultatele dupa cursul auxiliar sunt semnificativ 

mai bune). Din tabel, pentru a = 0,05 §i N = 9 obtinem valoarea critica R tab = 40. 
Pentru statistica T decizia se ia dupa regula: 

Daca R calc ) R tab , atunci respingem H 0 . In cazul nostru concret nu vom putea 
respinge ipoteza de zero. Deci, in ciuda aparentelor (la 6 din cei 10 nota a crescut §i a 
scazut numai la 3, iar cre§terile sunt mai mari decat scaderile), nu putem afirma ca 
diferentele sunt semnificative (probabilitatea sa obtinem diferente de acest gen din 
intamplare este destul de mare, peste 5%). 

Acceptarea ipotezei de zero in acest caz nu inseamna neaparat “cursul auxiliar nu 
a determinat created semnificative ale rezultatelor” ci doar ca “din analiza rezultatelor a 
1 0 studenti nu putem afirma existenta unei created semnificative a rezultatelor la testul 
de cuno§tinte”. Deseori, in asemenea situatii, cand rezultatul unui test statistic este la 
limita, este bine sa se extinda studiul pe un lot mai mare pentru a se putea atinge 
semnificatia statistica. 

Observatie: Rezultatele obtinute ar fi asemanatoare §i daca variabilele ar fi fost 
considerate numerice in loc de ordinale §i am fi aplicat testul t pereche pentru diferente 
avand valoarea D = + 1.4 §i Sj = 0.83 pentru (N = 10); concluziile ar fi §i in acest caz la 

fel ca cele obtinute cu testul Wilcoxon. 

E. Se compara n valori medii 

. Ipoteza de zero: H 0 : X 1 = X 2 = .... = X n (II.5.14.) 

. Test aplicat: ANOVA (ANalysis Of VAriance). 

Testele de tip ANOVA formeaza o intreaga clasa ce face obiectul de studiu al 
unui intreg capitol al (bio) statisticii numit “analiza variantei”. Elementul central in 
analiza variantei este impartirea “variantei” valorilor individuale (formula 5.7.b) in 
finctie de originea posibila (sursele) variatiei. 

Analiza variantei se aplica pentru testarea egalitatii a n valori medii in doua 
variante principale: 

Analiza unifactoriala (“one-way analysis”) - pentru a compara n serii 
independente, obtinute pe loturi diferite. 

Analiza bifactoriala (“two-way analysis”) - pentru a compara n serii 
dependente, obtinute pe acela§i lot, in n conditii. 
a) Analiza unifactoriala 
. Tipuri de analiza unifactoriala: 
i° - parametrica: testul t nepereche generalizat pentru n serii 
i 00 - neparametrica: testul Kruskal - Wallis 
. Fundamentare teoretica: 

Fie n serii experimentale obtinute pe loturi independente, un lot j avand Nj 
indivizi. Fiecare lot corespunde unei conditii pe care o vom numi “tratament”; avem 
deci n tratamente; pentru tratamentul j analizam lotul corespunzator. 
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Xji , Xj 2 , Xji , Xj N i , avand: 

n j 

media X j = (£ X ) / Nj (0.5.15) 

i 

varianta = SSj / (Nj - 1) (II.5.16) 

n j 

suma patratelor abaterilor: SS — (X. — X..) 2 ', (SS = sum of squares). 

J v J J l 7 

i 

Daca amestecam loturile obtinem un grup mare avand in total N indivizi, ale caror 
valori le notam acum cu X f : 


N = YjN j (II. 5. 17) 

j 

Pentru acest lot global avem o medie generala: 




( N 

% 


( n 


A = 


IN = 

H N J X J 


\i=l 

J 


V j 



§i suma totala a patratelor (TSS = toto/ of squares): 

TSS = IfX - X,. f 

i=1 

(II. 5. 19) 

Esenta in testele ANOVA este a diviza aceasta varianta totala TSS (exprimata de fapt 
aici prin suma totala a abaterilor tuturor valorilor individuale X { fata de media globala 


X ) in varianta datorata variatiilor valorilor individuale X - j din fiecare grup j fata de 
media grupului X . , numita varianta reziduala (RSS) §i varianta datorita 
tratamentelor (treatment variance). 


TSS =RSS + TrSS 


(II. 5. 20) 


Suma patratelor abaterilor pentru varianta reziduala este: 


RSS = ±SS J = ±(Z^ l -X l f) 

j j l 

(II. 5.21) Pentru cele n serii (“tratamente”), cuprinzand un total de N indivizi , 
toate cele N valori sunt independente deci numarul gradelor de libertate (d.f. = degrees 
of freedom) pentru TSS este N. Numarul gradelor de libertate pentru tratamente este : 

v-dfTr -n-\ (II.5.22) 


iar pentru reziduale este: 

v 2 =dfR = N-(n- J \). 


(II. 5.23) 
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De fapt RSS §i TrSS calculate cu (II.5.21) §i (II.5.20) sunt sume patrate; pentru a 
reprezenta variante cu adevarat ele trebuiesc divizate cu numarul corespunzator de 
grade de libertate: (Ms = mean square). 

MSTr = (TSS - RSS) / v 7 (II.5.24) 

MSR = RSS/v 2 (II. 5.25) 


Raportul a doua variante prezinta o distribute F cu (vi;v 2 ) grade de libertate: 


MSTr 

MSR 


Tabel 11.11. Scaderile tensiunii sistolice dupa patru zile de tratament, pe 3 loturi. 

Valorile negative indica o cre§tere a tensiunii. in fiecare serie valorile au fost 
ordonate. Pentru seria globala avem: 


Tratament j 
Individ i 

1 

2 

3 


1 

20 




2 

15 




3 

15 




4 

10 




5 

5 




6 

5 


m 


7 

0 

5 

- 


8 

-5 

0 

- 


9 

-5 

-10 

- 


10 

-10 

- 

- 


n j 

10 

9 

5 

N = 24 

x j 

5 

10 

20 

X =10 

ss ; 

900 

1200 

250 

RSS =2350 

lix-x ,) 2 

1150 

1200 

750 

TSS = 3100 


Daca seriile nu difera semnificativ intre ele, varianta care ramane atribuita 
tratamentelor MSTr este mica, varianta to tala fiind explicate aproape integral de 
rezidualele MSR (variatiile individuale din fiecare grup), deci F calc va avea valori mici. 
insa daca seriile difera semnificativ, MSTr va reprezenta o portiune insemnata din 
varianta totala §i F va fi mare. 

Stabilind un prag de semnificatie a (5% sau 1%) decizia testului se ia astfel: 

- daca F ca i c > ^y x y 2 (tabel), atunci p < a, adica respingem H 0 

- daca F calc < F tab , atunci acceptam H 0 

Actualele pachete statistice prezinta rezultatele in forma standard a tabelelor 
ANOVA §i calculeaza direct valoarea lui p interpretabila conform fig.II.14. 
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Exemplul 11.13. Comparam 3 tratamente antihipertensive obtinand pe trei loturi 
rezultatele din tabelul II. 1 1 . 

Din tabelul distributiei F avem: 

Kl 2 = 3 ’ 44 F 2°22 = 5 ’ 72 

Cum F calc) F 2,22’ rezulta p <0,05 deci respingem ipoteza de zero H 0 vom considera 
ca intre cele 3 serii avem diferente semnificative. 

In tabelul 11.12. sunt prezentate datele sintetice ale testului ANOVA. 


Tabel 11.12. Tabelul ANOVA cu datele brute din tabelul II.7 


Sursa de 
variatie 

Grade de 
libertate 

Suma 

patratelor 

SS 

Media patratelor 
Ms 

Raportul F 

F 

Tratament 

2 

750 

375 

3,48 

Reziduale 

22 

2350 

106,8 


Total 

24 

3100 




Observatii : 

- Cel mai adesea, dupa aplicarea unui test ANOVA pentru mai mult de doua 
serii, analiza poate continua prin compararea pe rand a cate doua serii prin testul t 
standard (sau Mann-Whitney - Wilcoxon in caz neparametric) cu ajustarea 
corespunzatoare a lui a functie de numarul de teste. 

- Pentru numai doua serii rezultatul obtinut prin ANOVA este identic cu cel 
obtinut prin testul t nepereche. 

b) Analiza bifactoriala 

- Tipuri de analiza bifactoriala: 

1° - parametrica: testul t pereche generalizat 

ii 00 - neparametrica : testul Friedman 

Fundamentare teoretica 

Fie n serii de valori experimentale obtinute pe acela§i lot, cu volumul de N 
indivizi, in n conditii diferite. Fiecare serie de valori corespunde unei conditii pe care o 
vom numi §i aici “tratament”. Fiecare individ i este supus tuturor celor n tratamente. 
Spre deosebire de cazul anterior, cand luam in considerare un singur factor ce ar putea 
influenta varianta - tratamentul, de aceasta data vom lua in considerare §i al doilea 
factor, de exemplu individul - fiecare individ are reactii particulare la fiecare tratament. 
in general in ANOVA bifactoriala gruparea dupa primul factor se face in “tratamente”- 
j, iar dupa al doilea factor se face in “blocuri”- i. 

Sa facem urmatoarele notatii: 

Xj f - o valoare individual^ pentru tratamentul j la blocul i (individul i) 

N 

X. # = CZ J X JI )I N ~ media unui tratament (II. 5. 27. a) 
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x« = C£ x j,)/> 


- media unui bloc 


(II. 5.27 .b) 


Xji ) / (Nn) = (£ j X. i )/N = i^Xj ,)/n - media global (II.5.27.c) 


Gradele de libertate sunt: 

. total: v = N . n 
. pentru tratamente: v\ = n - 1 
. pentru blocuri: v”j = N - 1 
. pentru reziduale: v 2 — N *n — (N 


(II. 5.28. a) 
(II.5.28.b) 
(II. 5.28. c) 
(II.5.28.d) 


Tabelul 11.13. Prezentarea tabelului ANOVA pentru analiza bifactoriala 


Sursa variatiei 

Grade de libertate 

df 

Suma 

patratelor 

SS 

Media patratelor 
ms 

Raportul 

F 

Tratamente 

Blocuri 

(indivizi) 

v l =n-l 

v[=N-l 

TrSS 

BISS 

M[ - TrSS Ivy 

M[ = BISS/v j' 

MJ M 2 (P) 
m[ / M 2 (P ) 

Reziduale 

v 2 =N n -(N + n- 2) 

RSS 

M 2 = RSS lv 2 


Total 

II 

1= 

TSS 





(II. 5.29. a) 

(II. 5.29 .b) 
(II. 5.29. c) 
(II.5.29.d) 

(II. 5. 30) 


Tabelul ANOVA pentru prezentarea rezultatelor va fi de forma 11.13. 


Pentru ca ordinea aplicarii tratamentelor sa nu fie aceea§i la toti indivizii (acesta 
ar putea influenta efectele), se aloca tratamente in ordine intamplatoare. Cel mai potrivit 
este sa se foloseasca a§a numitul patrat latin avand pe linii sau coloane ordinea 
tratamentelor; de exemplu, pentru 4 conditii sau tratamente (A,B,C,D) am putea avea 
patratul: 
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A 

B 

C 

D 

C 

A 

D 

B 

D 

C 

B 

A 

B 

D 

A 

C 


(II. 5. 31) 


Indivizii (sau blocurile) se atribuie intamplator acestor succesiuni de tratamente. 

F. Se compara 2 sau n dispersii (deviatii standard). 

Uneori este necesara in practica verificarea egalitatii statistice a unor indicatori 
de dispersie - de exemplu, testele de semnificatie aplicate pentru valori medii presupun 
o egalitate statistic^ a dispersiilor seriilor care trebuie testate inainte de aplicarea testului 
pentru medii. 

Dintre testele pentru compararea indicatorilor de dispersie vom prezenta cateva 
mai des intalnite: 

- pentru a compara doua deviatii standard 

- pentru a compara n deviatii standard obtinute pe serii diferite 

- pentru a compara n deviatii standard obtinute pe acela§i lot. 


a. Se compara doua deviatii standard 

. Ipoteza de zero: H 0 :cr l = cr 2 

. Test aplicat: testul (exact) F-Fischer-Snedecor 
. Fundamentare teoretica 

Raportul a doua dispersii ale unor populatii cu distribute normala prezinta o 
distribute notata cu F, numita distributia Fischer. 

Fie doua serii experimentale, de volume N { §i N 2 , avand dispersiile Sf §i 
S 2 ; le notam cu indicii 1 §i 2 astfel incat Sf > S 2 adica 5 (1) =max(5 19 5 2 ). Se 
calculeaza raportul: 

F = S 2 (X) I S 2 (1) (II. 5. 32) 

Se alege tabelul cu valorile lui F dupa pragul de semnificatie dorit (0,05 sau 
0,01) §i pentru cele doua valori ale gradelor de libertate: 

v,=N,~ 1; v 2 = N 2 — 1 (II. 5. 33) 

Ipoteza de zero se accepta daca indicele F respecta relatia: 

F C a,c< (11.5.34) 

Pachetele statistice dau de obicei valoarea lui p interpretabila conform fig. 11.14 


Exemplu: Consideram loturile 2 §i 3 din tabelul II. 1 1 . 

Pentru lotul 2: $ 2 = = 1 50 = ,S 2 

2 9-1 f1j 

Similar: s 2 ,= — = 62J = S> 

3 5-1 <2) 

Calculam: F = / s 2 = ^ = 2,4 • Din tabel, pentru a = 0,05 avem: F 8 0 ; 025 = 6,04 

62,5 

deci F calc ( F tabd §i vom admite H 0 de§i diferentele dispersiilor pareau destul de 
mari. 
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b. Se compara n deviatii standard obtinute pe serii diferite 
. Ipoteza de zero: H 0 : <J l =<J 2 — •••• — <5 n 

. Test aplicat: testul lui Bartlett 
. Fundamentare teoretica 

Pentru n serii experimentale de volume Nj , medii X . §i deviatii standard S - , 

notam: 


n 


- grade de libertate: v = Nj — 1 ; 

1 

II 

II 

> 7 * 

(II. 5. 35) 


Yl 

- numar total de indivizi: N = ^ j N j 

7 = 1 

2 1 n 2 

- dispersie globala: S = — X v j Sj 

(II. 5. 36) 

(II. 5. 37) 


V j 


coeficientul: 


C = 1 + 


f n 1 1 ^ 

i-- - 

v J V J 


3 (n - 1) 

1 n 

statistical X\ - -(y -lnS 2 7 - lnff 2 ) 


(II. 5. 38) 


(II. 5. 39) 


este o variabilitate aleatoare cu distribute $ cu n - 1 grade de libertate. 
- regiunea de acceptare a ipotezei zero H 0 este data de conditia: 


X B calc < xl n_\ (tab) 


(II. 5. 40) 


§i H 0 se respinge in caz contrar. 

Pachetele software de prelucrari statistice ne dau direct valoarea lui p. 


Exemplu: Sa comparam deviatiile standard ale celor 3 loturi prezentate in tabelul II. 1 1 
-serial: TV, =10, v 1 =9 =900/9 

- seria 2: N 2 =9, v 2 =8 ,S 2 =1200/8 

- seria 3: N 3 = 5, v 3 = 4 ,S 3 =250/4 

- aplicam formulele (II.5.36.) - (II.5.39.) 

.N = 24, n = 3 

■ S 2 = — - — (900+1200+250) = 112 
24-3 


• X 2 = 9,59 

- din tabelul pentru a - 0,05 §i n-1 = 2 grade de libertate avem: 

Zo, 05;2 - 5, 99 

- observam ca X^calc)) % oos- 2 ’ deci respingem H 0 §i vom considera ca 
dispersiile (derivative standard) difera semnificativ. 


111^ 1 15 

9 + 8 + 4y 9 + 8 + 4 ”14 
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c. Se compara n deviatii standard obtinute pe aceiasi indivizi 

. Ipotezade zero: H 0 :cr l - <j 2 <J n (sau S { - S 2 - = S n ) 

. Test aplicat: testul lui Cochran 
. Fundamentare teoretica: 

Pentru n serii de date experimentale obtinute pe acela§i lot de volum N, avand 
dispersiile S x , S 2 S n , se alege: 

S mBl = maxes,, S 2 ,....,S b ) (D.5.41) 

§i se calculeaza: 

n 

S 2 =^s; (II. 5.42) 

j 

Statistica 

Q = s^/S z (II. 5.43) 

este comparata cu valoarea lui Q din tabelul lui Cohran; tabelele pentru Q sunt 
asemanatoare cu cele pentru F: sunt realizate pentru doua valori ale lui a (0,05 §i 0,01) 
§i depind de 2 indici: n §i u = N-1 
(numarul de grade de libertate). 

Regiunea de acceptare a ipotezei de zero se alege daca este satisfacuta conditia: 
Q( calc) < Q^ v ( tab ) (II.5.44) 

Pachetele software de prelucrari statistice dau direct valoarea lui p pentru 
interpretarea testului conform fig. 11.14 


G. se compara proportii (procente) 

in cazul variabilelor nominale (calitative), indivizii din intregul e§antion sunt 
grupati in diferite clase, fiecare clasa avand caracteristica o proportie (procent). 

Daca impartirea se face in numai doua clase, distributia se nume§te binominala, 
daca se face in mai multe clase se nume§te multinomiala. 

Testele pentru varibilele nominale sunt numeroase, acoperind toate categoriile de 
teste (semnificatie, omogenitate etc.), astfel incat in cadrul cursului vom prezenta doar 
urmatoarele situatii, mai des intalnite: 

a. se compara o proportie experimentala cu o valoare data 

b. se compara doua proportii experimentale 

c. se compara o distribute experimentala cu una teoretica - test de concordanta 

d. test de omogenitate pe tabel de contingenta 

e. test de independents pe tabel de contingenta 


a. Se compara o proportie experimentala cu o valoare data 


. Ipoteza de zero: p = p 0 

Conditie: se lucreaza pe loturi mari, astfel incat sa nu fie vreuna din clase cu mai 
putin de 5 indivizi, deci N sa fie altfel incat N > 5 sau 

N<- Po y 5 - 

. Fundamentare teoretica 
Statistica 


Z = 


P~Po 




Pq(X-Po) 

N 


(II. 5. 45) 
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are o distribute normala, deci intervalul de acceptare al ipotezei de zero va fi conditia: 
Z (ca ’ lc) e(-Z a/2 ,+Z a/2 ) (II. 5.46) 

adica pentru a = 5% Z a/2 = 1,96. 

Pachetele software de prelucrari statistice ne dau valoarea lui p (probabilitatea ca 
ipoteza de zero sa fie adevarata) interpretabila conform fig. 11.14. 


Exemplu 11.14. Sa se verifice daca este adevarata afirmatia ca 4% dintre barbati sunt 
daltoni§ti. 

Cum p Q = 0,04 §i trebuie ca N p0 > 5 rezulta iV > 125. 


Vom lua un lot de 150 barbati pe care obtinem N x = 8daltoni§ti §i N 2 =142 vedere 
colorata normala. 

Avem deci N = 150, ^ = 8/150 = 0,053; p 2 = 1 42 / 1 50 = 0,946 


V 
z = 


0 . 053 - 0.946 


V 150 
0 , 053 - 0,04 
0,01.6 


= 0.018 


= 0,833 


Observamca Z calc e (-1.96; + 1.96) deci acceptam H 0 . 


b. Se compara doua proportii experimentale 
. Ipoteza de zero: p x - p 2 

. Conditie: se lucreaza pe loturi mari incat sa nu fie vreuna din clase cu mai putin de 
5 indivizi 

. Fundamentarea teoretica. 


Statistica Z = ^ (II.5.47) 

S p d s pd 

au o distribute normala. Pentru eroarea standard a proportiilor folosim formula (4.14.) 
sau 


unde: 


1 


1 




(II. 5.48) 


NjPi+N_ 2 p 2 
P ° N { + N 2 

Regiunea de acceptare este data tot de (II. 5. 46.). 


(II.5.48.b) 


Exemplu 11.15. Verificam daca proportia de decese prin cancer de plamani este aceea§i 
la barbati §i femei. intr-un studiu efectuat pe doua loturi: 

-loti: A/) = 180 certificate deces barbati inregistrate in 3 luni, din care 

p x - 14/ 180 = 0,0777 cu diagnosticul de mai sus 


lot 2: N 2 = 165 certificate deces femei, acela§i interval, cu 
p 2 =5/165 = 0,030 




0,077-0,9222 0,03-0,97 

+ — = 0,024 


180 


165 
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z _ (0,0777 -0,030):100 _ 19g 
2,4 

Observam ca Z {calc) ) Z ajl - 1,96 deci respingem H 0 §i vom considera ca decesul prin 
cancer de plamani apare semnificativ mai free vent la barbati decat la femei. 

c. Se compara o distributie experimentala cu o distributie teoretica de 

proportii 

in cazul variabilelor nominale, daca avem n clase (distributie multinominala), 
rezultatele experimentale obtinute prin analiza unui lot de N indivizi se exprima cu 
ajutorul unui tabel de forma tabelului 11.14. 

. Ipoteza de zero: Cf = E } V/ = 1 , ..., n adica valorile observate experimental Oj 
difera semnificativ de cele a§teptate E . (“observed values”), pentru toate clasele j. 


Tabelul 11.14. Prezentarea datelor pentru aplicarea testului de concordonta la o distributie 
multinominala. 


Caracteristica 

Clasa 

1 

Clasa 

2 


Clasa 

n 

Total 

Valori 

experimentale 

O! 

o 2 


O n 

N 

Valori 

teoretice 

Ei 

e 2 


E„ 

N 


. Test aplicat: testul % 2 a l lui Pearson 
. Fundamentare teoretica: 

Statistica 

j 1 

are o repartitie $ . Pentru ca ipoteza de zero sa poata fi respinsa 

Z 2 (calc) < v (tab) 

. Pachetele statistice dau valoarea lui p interpretabila conform fig. 11.14. 

. Observatie : Valorile teoretice trebuiesc calculate in functie de specificul 
studiului; ele pot fi §i valori fractionare. Ele pot fi evaluate §i pentru un total diferit §i 
apoi convertite pentru acela§i total. 

Exemplul 11.16. Dorim sa studiem raspandirea grupelor sanguine §i facem ipoteza ca 
sunt uniform raspandite. Rezultatele experimentale obtinute pe un lot de 80 de indivizi 
sunt prezentate in tabelul II. 15. a. 


Tabel II. 15. a. Repartitia grupelor sanguine intr-un lot cu N = 80 


(Caracteristica) 
Grupa sanguina 

O(I) 

A(II) 

B(III) 

AB (IV) 

Total 

Valori 

experimentale 

22 

33 

14 

11 

80 

Valori 

teoretice 

20 

20 

20 

20 

80 


(11. 5. 49) 

(11. 5. 50) 


80 




























D. Lungeanu, Gh.-I. Mihala§ 


Ipoteza de zero: grupele sanguine sunt uniform raspandite in populatia analizata. 
Conform formulei (6.49.) obtinem: 

2 42-20Z 43-20Z <4-20^ <1-20^ 

20 20 20 20 
Din tabel, pentru a - 5% gasim Xq 05 3 =7,815 deci 

y 2 (calc) (% 2 (tab) §i vom respinge H 0 afirmand ca din studiul efectuat rezulta ca 
grupele sanguine nu au o raspandire uniforma in populatia analizata. 

Observatie : noi am efectuat calcule anterioare pentru ipoteza ca grupele 
sanguine ar fi uniform raspandite. Putem insa sa verificam §i alte ipoteze. De exemplu, 
un studiu efectuat in America Latina afirma ca acolo grupele sanguine ar avea 
raspandirea: 30% grupa 0, 15% grupa A, 40% grupa B §i 15% grupa AB. in acest caz 
tabelul II.5.11. ar deveni: 


Tabel 77.5.77. Repartitia grupelor sanguine intr-un lot cu N = 80 


(Caracteristica) 

Grupa sanguina 

O(I) 

A(II) 

B(III) 

AB (IV) 

Total j 

Valori experimentale 

22 

33 

14 

11 

80 

Valori 

teoretice 

24 

12 

32 

12 

80 


iar j 2 =15.9 deci §i in aceasta situatie ipoteza H 0 este respinsa. 


d. Test de omogenitate pentru tabele de contingenta 

Sa introducem mai intai notiunea de tabel de contingenta. in cazul variabilelor 
nomiale (sau variabile numerice dar cu valori impartite pe intervale), daca urmarim 
impartirea dupa doua caracteristici (doua criterii de clasificare) obtinem un tabel de 
contingenta. 

Definitie: Tabelul de contingenta reprezinta o forma de prezentare a datelor variabilelor 
nominale (sau pe clase) dupa doua caracteristici: una plasata pe linii §i alta plasata pe 
coloane. 

Un exemplu de tabel de contingenta este prezentat in tabelul II. 5. 12. 


Tabel 11.16. Model de tabel de contingenta 



elev/student 

muncitor 

taran 

intelectual 

alte 

Total 

Primul 
criteriu de 
clasificare: 
Mediul 

Urban 







Rural 








Tabelul expus se nume§te tabel 2x5 aratand numarul de clase dupa primul, respectiv al 
doilea criteriu de clasificare. 

Un test de omogenitate aplicat unui tabel de contingenta are menirea de a 
verifica daca proportiile diferitelor clase pe un rand (coloana) sunt aproximativ acelea§i 
§i pe celelalte randuri (coloane). 

Valorile experimentale intr-un tabel de contingenta le notam ca in tabelul 11.17. 
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Tabel II-l 7. Notatii in tabelul de contingenta cu L linii si C coloane pentru un egantion de N indivizi 



1 

j 

C 

Total 

l 



a u 

°1C 

K 

i 





.... 

K 


<J n .... 

CT- 

<J- 

L 

IL 

ij 

1C 



a L1 .... 

CJ Lj ... 

(J L * 

L,, 

Total 

C, .... 

C*j 

. a c 

N 


Pentru notatiile din tabelul 11.17 sunt adevarate relatiile de mai jos: 


jp 

II 

(II. 5. 51. a) 

II 

(II.5.51.b) 

C L L C 

w -Xg,-X i ..-X2>, 

j 1 1 J 

(II.5.51.C) 

v = (L-V(C-l) 

(II. 5. 52) 


Valorile a§teptate E { . se calculeaza pentru fiecare element al tabelului dupa relatia: 

A* -c*. 

E =— (II. 5. 53) 

lJ N 

astfel incat totalurile pe linii §i coloane vor ramane nemodificate. De obicei se 
construie§te inca un tabel de forma tabelului II.7 cu deosebirea ca, in loc de valorile 
observate, in casute se tree valorile a§teptate. Marginile vor ramane nemodificate. 

Avand ambele tabele putem trece la aplicarea testului. 

. Ipoteza de zero : H {) : Oy = E tj , pentru \/ tJ 

. Test aplicat : testul al lui Pearson. 

. Fundamentare teoretica: 

Statistica 

X 2 - 

' ./ E ij 

are o distribute cur grade de libertate. 

Pentru un prag de semnificatie ales, a, se cauta in tabel valoarea 

regiunea de acceptare cand este indeplinita conditia (6.50.). 

Programele de calculator dau direct valoarea lui p. 


(II. 5. 54.) 

r §i se stabile§te 
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Exemplul II.17.a. ComparSm douS tratamente A §i B pe douS loturi avand N l =100 
respectiv N 2 = 50 pacienti. Rezultatele obtinute sunt trecute in tabelul II. 17. a. 


Tabelul II. 17. a. Rezultatele obtinute prin doua tratamente 



Ameliorat 

Neameliorat 

Total 

Tratament. A 

40 

60 

100 

Tratament B 

30 

20 

50 

Total 

70 

80 

150 


. Ipoteza de zero: H 0 : cele doua tratamente dau rezultate identice: 

. CalculSm valorile a§teptate conform (6.53.) §i obtinem tabelul II.17.b. 


Tabelul II.17.b. Rezultate agteptate in conditia respectarii ipotezei de zero 



Ameliorat 

Neameliorat 

Total 

Tratament. A 

46,6 

53,3 

100 

Tratament B 

23,3 

26,6 

50 

Total 

70 

80 

150 


Cu formula (5.54) obtinem: = 5,61, in timp ce din tabel, pentru a = 5% §i v = 

1 grad de libertate (pentru un tabel 2 x 2, cu 2 linii §i 2 coloane), avem x 2 05-1 = 3,84. 

Observam ca nu se respecta conditia X 2 (calc ) < X 2 (tab ), deci nu acceptam 
ipoteza de zero §i vom spune ca tratamentele dau rezultate diferite. 

e. Test de independenta pentru tabele de contingenta 

Un test de independeta are scopul de a stabili daca exista vreo relatie de 
dependents intre categoriile obtinute prin doua clasificari diferite; de exemplu intre 
culoarea parului §i sex, intre inaltime §i greutate, intre varsta §i adaptarea la efort etc. 

. Ipoteza zero: cele doua criterii de clasificare sunt independente (din punct de vedere 
probabilistic). 

. Test aplicat: testul % 2 a l lui Pearson 
. Fundamentare teoretica 

Abordarea este asemanatoare cu cea prezentata la testul ca test de 
omogenitate, avand §i acelea§i criterii de interpretare pentru regiunea de acceptare / 

respingere a H o- 

Exemplu 11.18. Pentru a stabili daca intre inaltime §i greutate exista vreo dependents , 
in cea mai simplS variants putem alege o valoare care imparte, in douS categorii 
aproximativ egale o populatie din care extragem un e§antion. Rezultatele culese sunt 
prezentate in tabelul II. 18. a. 
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Tabelul II. 18. a. Clasificarea indivizilor unui lot dupa inaltime $i greutate 


InSltime 

Greutate 

sub 175 cm 

peste 175 cm 

Total 

sub 70 kg 

40 

16 

56 

peste 70 kg 

8 

36 

44 

Total 

48 

52 

100 


. Ipoteza de zero: cele douS clasificSri sunt independente. 

. Conform ipotezei de zero putem calcula valorile a§teptate cu formula (6.53) §i obtinem 
tabelul II. 18.b. 


Tabelul II.18.b Valorile a§teptate la clasificarea indivizilor dupa inaltime §i greutate daca 
cele doua clasificari ar fi independente 


inSltime 

Greutate 

sub 175 cm 

peste 175 cm 

Total 

sub 70 kg 

26,88 

29,12 

56 

peste 70 kg 

21,12 

22,88 

44 

Total 

48 

52 

100 


Cu formula (5.54.) obtinem % 2 = 27,5, in timp ce din tabel, pentru a = 5% §i v = 
1 grad de libertate avem Xoos-i =3,84 ; mai mult, chiar pentru a = 1% §i y = 1 avem 


X ooos-i =7,88 deci putem respinge H 0 §i sS spunem cS diferentele sunt foarte 


semnificative. Respingerea lui H 0 in cazul nostru inseamnS respingerea ipotezei ca cele 


doua criterii de clasificare sunt independente. O analizS mai detaliatS a dependentei 
intre variabile se face prin metode adecvate ce vor ft prezentate in capitolul urmStor. 
Observatie: in cazul tabelelor de contingents, daca vreuna din cSsute (mai ales ale 
valorilor a§teptate) contine mai putin de 5% din observatii, se prefera a§a numita 
“corectie Yates”: 


Z 2 =z 


m 


E. 7-0,5/ 

E i 


(II. 5. 55.) 


astfel incat valorile foarte scazute (mai rare) sa nu influenteze prea puternic valoarea 
testului. 


6. CORELATIA SI REGRESIA 

Dupa cum am sesizat inca din cursul precedent, marimile pe care le analizam in 
diferite studii pot fi, fie independente intre ele, fie legate prin diferite relatii. 
Evidentierea unor relatii intre marimi poate sugera fie o fenomenologie cauzala, fie o 
corelatie mai complexa ce necesita studii aprofimdate. Oricum, respingerea unei ipoteze 
de zero intr-un test de independents da in general de gandit cercetatorilor, care pot 
sesiza o serie de aspecte interesante din simpla analiza statistics a datelor. Deseori 
analiza statistics a unor date sugereazS o serie de alte studii pentru precizarea 
fenomenelor care genereazS anumite dependence . 

DatoritS faptului cS analizele de acest tip urmSresc comportarea a douS variabile 
ele se numesc analize bivariate. 
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6.1. Relatii intre doua variabile cantitative 


A. Relatia de dependents 

a. Variabile independente 

Variabilele cantitative, fiind foarte des intalnite in studiile biomedicale, permit cea mai 
fma analiza a relatiei de dependenta/independenta. Sa ilustram acestea prin cateva 
exemple. 



. b y m m m • 










' ■ ’• 



h 



h 


Figura 11.16. Relatia intre inaltimea unui individ h, §i concentratia de hemoglobina din 
sange [Hb]. Repartitia aproape simetrica §i uniforma a punctelor sugereaza absenta vreunei 

corelatii 


Exemplul 11.19. Intr-un studiu pe un lot de 50 de indivizi am urmarit mai multe 
variabile, cantitative §i calitative. Daca alegem doua variabile (cantitative), de exemplu 
inaltimea h, respectiv concentratia hemoglobinei in sange, [Hb], intr-o reprezentare 
grafica in care luam pe axa Ox inaltimea h §i pe pe axa Oy concentratia hemoglobinei 
[Hb], fiecare individ va fi reprezentat print-un punct. Un astfel de grafic se nume§te 
“grafic de impra§tiere” (“scatter plot”). Datele obtinute sunt reprezentate in figura 
11.16. 


Repartitia simetrica §i fara vreo tendinta a punctelor in graficul obtinut sugereaza 
absenta vreunei legaturi intre cele doua marimi; vom spune despre ele ca sunt 

independente. 


b. Variabile dependente 

Daca reprezentam, relatia intre presiunea partiala a oxigenului din aerul respirat 
§i concentratia oxigenului dizolvat in sange am obtine un grafic de forma celui din fig. 
11.17. 



Figura 11.17. Dependeta concentratiei sanguine a oxigenului dizolvat de presiunea partiala a 
oxigenului din aerul respirat 
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LegStura dintre cele douS mSrimi este atat de vizibilS incat ne sugereazS nu 
numai acceptarea unei relatii cauzale ci chiar gSsirea unei formule pentru relatia dintre 
cele doua marimi; stabilirea unei astfel de formule (“formalizarea” matematicS a 
fenomenului) reprezintS obiectul de studiu al unui capitol important al informaticii 
medicale numit “modelare §i simulare”. in partea de biostatistica ne intereseazS doar 
faptul cS cele doua marimi nu par independente - la testul % 2 de independents, impSrtind 
p0 2 §i respectiv [0 2 ] in cateva clase (chiar §i cu numai 2 clase), vom respinge 
ipoteza de zero referitoare la independents, iar acceptarea unei dependence ne impinge 
spre cSutarea unei formule care sS exprime respectiva dependents. 

c. Variabile corelate 

in exemplul prezentat anterior, relatia cauzalS pSrea rezonabilS: in conditiile unei 
concentratii crescute a oxigenului atmosferic pare u§or acceptabilS (cauzal) o 
concentrate mai mare a oxigenului dizolvat in sange. Exists insS situatii in care datele 
experimental sugereazS o relatie de dependents, dar mecanismele fiziologice, la nivelul 
cuno§tintelor actuale, nu justifies pe deplin o relatie cauzalS directs, insS cel mai adesea 
admite o cauzS comunS pentru variatiile observate ale celor douS mSrimi; astfel de 
variabile se numesc variabile corelate. 

Un exemplu tipic il constituie corelatia intre inSltimea §i greutatea indivizilor 
(figura 11.18.), in care nu putem preciza cS una dintre variabile este cauza §i cealaltS este 
efectul. 



Figura 11.18 Corelatia inaltime-greutate pe un lot de 180 barbati adulti 


Analiza corelatiei inSltime-greutate, pe care o putem efectua cand cunoa§tem 
pozitia fiecSrui punct in graficul 11.18. este mult mai fmS decat cea din testul de 
independents din cursul precedent. Repartizarea punctelor in graficul din figurS, 
sugereazS o exprimare de forma “cu cat individul este mai inalt, cu atat greutatea sa ne 
a§teptSm sS fie mai mare.” 

B. Corelatia liniara 

in cazul in care considerSm cS punctele dintr-o diagrams de imprS§tiere se 
situeazS pe o dreaptS, corelatia se nume§te corelatie liniara. 

a. Coeficient de corelatie 

“Intensitatea” corelatiei este apreciatS print-un parametru numit coeficient de 
corelatie Pearson. 
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■ Formula coeficientului de corelatie este: 


r = r 


^ Icv-xHY.-n 
5 A ^ ( x,-xr 


unde 


5 2 si S 2 reprezinta varianta lui x, respectiv y: 

, 2 X<X-*> ; s! = X(i;-F) J 


N ’ N 

iar S xy se numcstc convarianta intre x §i y §i este dat de: 


S X y ~ 


Y j (X,-X)(Y i -Y) 


N 


(II.6.1) 


(II. 6.2) 


(II. 6. 3) 


ii 0 - Proprietati. 

- coeficientul de corelatie r are valori cuprinse intre -1 §i +1 

r E [-1, +lf (11.6 A) 

- valorile pozitive ale lui r indica o corelatie directa intre x §i y (cre§terea lui x este 
insotita de cre§terea lui y, figura II. 19. a), in timp ce valori negative indica o corelatie 
inversa (cand x create, y scade, figura II.19.b.). 



a. Corelatie directa b. Corelatie inversa 

Figura 11.19. Ilustrarea corelatiei liniare directe §i inverse 


- Valorile absolute mari ale lui r (apropiate de +1, respectiv -1) indica o corelatie 
puternica, in timp ce valorile mici (in jurul lui 0) indica o corelatie slaba (sau absenta 
corelatiei) - figura 11.20. 



Figura 11.20. Aprecierea “intensitatii” corelatiei liniare dupa valoarea lui r 
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Observatie: Coeficientul de corelatie Pearson arata numai in ce masura datele 
experimentale se potrivesc unei reprezentari descrise de o dreapta; deci o valoare 
scazuta a lui r nu inseamna neaparat corelatie slaba ci corelatie liniara slaba , insa ar 
putea fi puternica dar de alt tip. 


b. Semnificatia coeficientului de corelatie 

Valorile lui r depind atat de gradul de impra§tiere al valorilor experimentale cat 
§i de N - numarul de puncte. Uneori, cand N este mic putem obtine, din intamplare, 
valori ridicate pentru r, conducandu-ne la concluzii hazardate cu privire la intensitatea 
corelatiei. De aceea, se poate testa semnificatia coeficientului de corelatie liniara r. 

. Ipoteza de zero: H 0 :p= 0 ( p — coeficientul de corelatie liniara pentru intreaga 
populatie, r = coeficientul de corelatie obtinut pe un e§antion). 

. Test aplicat: testul t (Student) 

. Fundamentare teoretica: 

Se poate demonstra ca raportul: 


N - 2 
1-r 2 


(II. 6.4) 


are o repartitie Student cu v= N - 2 grade libertate. 

Pentru un prag de semnificatie a gasim in tabel valoarea t a/2v . in caz ca 


t calc < t fah vom accepta H 0 ; in caz contrar o respingem §i vom spune ca avem o 
probabilitate ridicata de a avea intr-adevar o corelatie liniara. 


Respingem H 0 


evidenta 

pentru 

corelatie 

liniara 


<yj 2=2.5% 


r 

-1 -0.5 0 +0.5 +1 



Figura 11.21. Regiunile de acceptare/respingere a H () pentru coeficientul de corelatie. 

Eroarea standard a coeficientului de corelatie se calculeaza cu relatia: 

S r =EE (11-6.5) 

Jn 

deci pentru pragul de semnificatie a , putem localiza intervalul in care se gase§te 
coeficientul de corelatie al populatiei p prin relatia: 

r = ps(r- t a/2r ■ S r ; r + t a/2v ■ S r ) (II.6.6) 
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Pe baza relatiei (II.6.6) se poate construi un tabel sau se poate ridica un grafic cu 
regiunea de acceptare / respingere a ipotezei de zero (figura 11.21). 


c. Dreapta de regresie 
i 0 - Definitie 

in cazul unei corelatii liniare, dreapta care trece “cel mai bine” printre punctele 
experimentale se nume§te dreapta de regresie. 

ii 0 - Ecuatia dreptei de regresie 

DacS notSm cu x variabila independents §i cu y variabila dependents, atunci 
ecuatia unei drepte y =f(x) are forma: 

y = a + bx (II. 6.7) 

in care a se nume§te ordonata la origine (limba engleza “ intercept ”) iar b se nume§te 
panta dreptei (limba engleza “slope”) - figura 11.22. 



Figura 11.22. Semnificatia parametrilor pentru dreapta de regresie liniara. 


iii ° - Metoda celor mai mici patrate. 

Pentru determinarea coeficientilor a §i b din ecuatia dreptei vom considera cS 
“cea mai bunS” dreaptS care trece printre punctele experimentale este cea pentru care 
“suma pStratelor abaterilor, s t este minimS” , adicS: 

SSE = Z = min- (II.6.8) 


iv ° - Formule pentru coeficientii dreptei de regresie. 

. Fundamentare teoreticS. 

ObservSm cS pentru un punct experimental P(X i ,Y i \ gSsim dreapta de 

/v /v yv 

regresie punctul P’(X i ,Y i ) la distanta £ { — Y K unde Y reprezintS valoarea pe 
care ar avea-o variabila Y pentru valoarea lui dacS punctul s-ar gSsi pe dreaptS: 
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Y = a + bx t 
(II. 6.9.) 

Suma SSE depinde de coeficientii a §i b: 

SSE = ^ - a - bx t ) i 2 = min (II.6.8.b) 


Valoarea minima se obtine cand derivatele in raport cu a §i b se anuleaza: 

ESSE = o , dSSE = 0 (II.6.8.C) 

da ’ db 

Se obtine un sistem de doua ecuatii cu doua necunoscute, a §i b, care prin rezolvare ne 
da rezultatele: 


s^ = T[x 1 -xx^-yj_ = y 

S 2 X T(x r ~x) 2 ^ s x 


(II. 6.9. a) 


a-Y -b'X 


(II.6.9.b) 


y - Intervale de incredere pentru a §i b 

. Fundamentarea teoretica. 

Celor N perechi de valori reprezentand cele N puncte li se asociaza 
V = N — 2 grade de libertate, ele fiind legate §i prin relatia dreptei de regresie. Daca 
notam dispersia abaterilor cu S 2 : 

SSE _ _Z^-3 } ) 2 


S 2 =■ 


N-2 N- 2 N-2 

atunci eroarea standard pentru panta este: 


s b = - 


d! 

iar pentru ordonata la origine 




X‘ 


(II.6.10) 


(II. 6. 11. a) 


(II.6.11.b) 


\N Y.( Xi - X 2 

Pentru un prag de semnificatie a , intervalele de localizare ale parametrilor 
estimati, a si b vor fi date de: 

b e(b - t a/2 , v • S„,b + t a/2 ' V • ; (II. 6. 12. a) 

a &( a- t a/2i , ■ S a , a + t a/2v ■ S a ) (II.6.12.b) 


i ° - Teste de semnificatie pentru a §i b. 

Avand calculate intervalele de incredere a estimatorilor, putem aplica teste de 
semnificatie pentru cei doi coeficienti ai dreptei de regresie. 

. Pentru panta: 

- ipoteza de zero: H 0 : b = 0 

- test aplicat: testul t pentru un prag de semnificatie OC ales §i pentru V = N — 2 
grade de libertate, din tabel avem t al2y . Calculam: 

t b caic=bls b (II. 6. 13. a) 

daca t calc < t tab se accepta H () , m caz contrar se respinge. 
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. Pentru ordonata de origine 

- ipoteza de zero : H 0 : a = 0 

- test aplicat: testul t pentru un prag de semnificatie OC ales §i pentru 
V = N — 2 grade de libertate, din tabel avem t a/2 v . Calculam: 

C, c = a/S a (II.6.13.b) 

§i daca t calc < t tab se accepta H 0 , in caz contrar se respinge. 

Observatie: aplicarea testului de semnificatie pentru panta este foarte importanta 
deoarece o valoare nesemnificativ diferita de zero arata o independents intre variabile, 
chiar daca este mare §i satisface testul de semnificatie. 

Exempliil 11.20. Corelatia intre pH-ul sanguin §i frecventa cardiaca poate fi 
reprezentata grafic ca in figura 11.23. 













N = 45 

b = 0.02 

r = 0.92 




^'calc > ^tab 


-I t 1 

50 15 100 FC (min ) 


Figura 11.23. Corelatia intre pH-ul sanguin §i frecventa cardiaca: deoarece pHs variaza 
foarte putin, punctele se inscriu bine pe o dreapta §i obtinem o valoare mare pentru r, care 
satisface §i testul de semnificatie t. insa panta nu difera semnificativ de zero, deci putem 
considera marimile ca independente 


vii ° - Originea denumirii dreptei “de regresie” 

Numele de dreapta de regresie a fost introdus de W. Galton, care a studiat 
relatia intre inaltimea copiilor §i inaltimea parintilor. De§i pe ansamblu copiii au avut o 
inaltime medie mai ridicata decat a parintilor, aceasta cre§tere nu era uniform 
repartizata, find mai accentuata pentru copiii avand parinti mai scunzi, in timp ce 
inaltimea copiilor provenind din parinti inalti era deseori mai mica decat a parintilor 
(figura 11.24.). 

Interpretarea de “tendinta catre mediocritate” data acestor observatii suscita 
inca §i azi o serie de discutii. 
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viii - Testarea liniaritatii 

Corelatia liniara este cea mai simpla §i cea mai studiata, de aceea in analiza 
corelatiei ea se efectueaza prima; deseori, obtinerea unor rezultate ce indica o corelatie 
liniara slaba este interpretata - nejustificat - ca absenta a unei corelatii. Acest lucru 
poate fi adevarat insa exista dese situatii cand variabilele sunt destul de puternic 
corelate insa nu liniar (figura 11.25.). 


Pentru a verifica liniaritatea se construie§te o noua variabila: 


l_ VF “VF 

. Ipoteza de zero: H 0 : regresia este liniara 
. Test aplicat: testul Z al distributiei normale, astfel: 

- alegem un nivel de semnificatie OC §i luam din tabel Z a 

-daca | Z. | < Z a \/i = L..N 

atunci acceptam H 0 , in caz contrar o respingem. 


(II. 6. 14. a) 


(II.6.14.b) 



Figura 11.25. Corelatia neliniara 
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0 A 

ix Incadrarea dreptei de regresie 

Dreapta de regresie teoretica Y = a + ft X poate lua valori in intervalul (aici a 
= ordonata la origine, (3 = panta) 

Y e (Y-t • S ~ , Y + 1 • s 9 ) (II.6.15) 

unde t este valoarea din tabelul repartitiei t pentru un prag de semnificatie ales. 



Figura 11.26. Incadrarea dreptei de regresie in intevale de incredere de 95% §i 99% 


Eroarea standard a estimarii lui Y pentru fiecare X se calculeza cu: 

s, = VF- 


1 


i 

h 

N 


X(x-x ) 2 




( I ^) 2 

N 


(II. 6. 16) 


In felul acesta in reprezentarea grafica a diagramei se traseaza §i limitele de 
incadrare a dreptei (figura 11.26.). 


Observatie: Dreapta de regresie a variabilei Y fata de X este diferita de dreapta de 
regresie X fata de Y (deci cea care s-ar obtine daca am inversa axele pe care sunt plasate 
cele doua variabile). De aceea, cand ar exista pericol de confuzie, coeficientii dreptei y 
=f(x)=a + bx se noteaza b y / x § i a y / x in timp ce pentru dreapta X = f(y) se noteaza 
b x/ respectiv a x/y . Coeficientul de corelatie r ramane acela§i in ambele situatii. 


C. Corelatii si regresii neliniare 

De§i corelatia liniara este intalnita destul de des, o serie de fenomene din meteria 
vie conduc la reprezentari destul de departate de o dreapta, astfel incat este mult mai 
potrivita alegerea altei relatii pentru descrierea dependendentei intre variabile in 
cazurile respective. 

a. Raport de corelatie 

in cazul regeresiei neliniare, in locul coeficientului de corelatie r se folose§te 
un alt parametru numit raport de corelatie, dat de formula: 




i- 








t] 


(II. 6. 17) 
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unde s , 8 §i T au semnificatia din figura 11.22., cu deosebirea ca punctul P va fi 
situat pe curba de regresie (deci nu neaparat pe o “dreapta”). in aceasta relatie y se va 
calcula conform curbei care se presupune ca descrie relatia dintre x §i y. Daca avem o 
corelatie liniara, raportul de corelatie va fi egal cu coeficientul de corelatie. 

Intervalele de incredere pentru rapoartele de regresie se calculeaza cu ajutorul 
coeficientilor F din testul lui Fisher. 

in cele ce urmeaza vom enumera cateva corelatii neliniare mai des intalnite in 
medicina §i biologie. 

b. Corelatii si regresii exponentiale 

Sunt foarte des intalnite in descrierea fenomenelor naturale. 

- Ecuatia regresiei exponentiale: 

y = a-e bx (II.6.18) 

avand coeficientii a §i b. 

- Exemple: 

i ° - corelatii exponentiale crescatoare (b > 0) 

- in fenomene de absobtie (intenstinala etc.) 

ii - corelatii exponentiale descrescatoare (b < 0) 

- clearance - functia de epurare (renala, hepatica) 

c. Corelatii §i regresii logaritmice 

- Ecuatia regresiei logaritmice: 

y = a + b • log x (II. 6. 19) 

- Exemple: 

. legea Weber - Fechner - intre senzatie §i intensitatea stimulului. 

d. Corelatii §i regresii ca functie putere 

- Ecuatia fimctiei putere: 

y - a . x b (II. 6. 20) 

- Exemple: 

. legea lui Stevens - intre frecventa impulsurilor nervoase pe o fibra §i intensitatea 
stimulului 


e. Corelatii si regresii hiperbolice 

- Ecuatia fimctiei hiperbolice: 

(x+a) (y + b) = k (II. 6.21) 

- Exemple: 

. legea lui Hill - relatia intre forta §i viteza de contractie pentru mu§chiul striat 
. legea lui Abbey - relatia intre intensitatea §i durata unui stimul luminos foarte scurt 
pentru determinarea pragului de sensibilitate. 

f. Corelatii §i regresii logistice 

- Ecuatia fimctiei logistice: 

a • x 

y = ~ (II. 6.22) 

b + x 


94 




D. Lungeanu, Gh.-I. Mihala§ 


- Exemple: 

. Cinetica Michaelis - Menten - relatia intre viteza reactiei enzimatice §i concentratia de 
substrat. 

. Curbele doza-efect-relatia intre doza unei substante medicamentoase §i efectul dozei 
respective asupra unui tesut (Ariens) 

(Observatie: reprezentarile functiei logistice se fac de obicei in coordonate y = f (log 
x), functia avand in acest caz o forma sigmoidala §i o serie de proprietati de simetrie). 

Exista §i alte tipuri de regresii cu care ne mai putem intalni: parabolice, 
polinomiale etc. 


D. Metode de fitare 

Definitie: Metodele folosite pentru a gasi “cea mai buna” dreapta, sau curba de 
un anumit tip, care sa treaca printre punctele experimentale se numesc metode de fitare. 

Cele mai des intalnite metode de determinare a parametrilor curbei (dreptei) de 
regresie sunt: 

a. Metoda celor mai mici patrate, pe care am descris-o anterior, bazata pe 
minimizarea sumei abaterilor punctelor experimentale de la curba de regresie (formula 
6. 8. a.) 

b. Metoda transformarilor liniare, prin care se efectueaza in ecuatia curbei 
de regresie o schimbare de variabila astfel incat, cu noile variabile reprezentarea sa 
devina o dreapta. lata cateva exemple: 


- pentru regresia exponential^ 

log y = z, log a = c : z = c + b.x 

- pentru regresia logaritmica 

log x = z : y = a + b . z 

- pentru regresia putere 

log y = z , log x = t, log a = c : t = c + b . t 

- pentru regresia hiperbolica 
1 ■ = z: y = -b + k . z 


x + a 


(11.6.18) ” 

(11.6.19) ” 

(11. 6.20) ” 

(11. 6. 21) ” 


- pentru corelatia logistica 

- = Z, - = f, I = c, - = d: z = c + d.t (II.6.22)” 

y x ’a a 

(Observatie: aceasta transformare liniara se mai nume§te transformarea Lineweaver 
Burke sau transformare dublu reciproca §i este mult utilizata in prelucrarea datelor de 
cinetica enzimatica). 


Trebuie mentionat ca metoda transformarilor liniare conduce la rezultate ce 
difera de metoda celor mai mici patrate aplicata direct la datele experimentale. 


c. Metoda asemanarii maxime - se bazeaza pe determinarea valorilor pentru 
care datele experimentale ar fi aparut a§a cu cea mai mare probabilitate. Rezultatele 
obtinute sunt apropiate de cele din metoda celor mai mici patrate. 
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6.2. Relatii intre doua variabile ordinale 

in cazul variabilelor ordinale parametrii defmiti anterior nu se mai potrivesc §i 
sunt definite marimi specifice pentru ranguri. 


A. Coeficientul de corelatie a rangurilor - Spearman 

Este un coeficient de corelatie liniara intre rangurile acordate diferitilor 
“indivizi” in clasificari diferite. 

a. Formula 

R ! (II. 6 . 23) 

N(N 2 - 1 ) 

unde D este diferenta intre rangurile individului i in cele doua clasificari. 

b. Exemplul II.21.a 

Consideram rezultatele obtinute prin testul psihologic Luscher de preferinta a 
culorilor pe doua loturi: un grup de adulti §i un grup de copii (cu varsta 5-15 ani) - 
tabelul 11.19. 


Tabel II. 19. a. Rangurile preferintei culorilor prin testul Luscher la doua loturi 


Culoarea 

Rangul 

Preferintei 

D 

2 

D 

Copii 

Adulti 

R=Ro§u 

"l 

5,5 

-4,5 

20,25 

G=Galben 

2 

5,5 

-3,5 

12,25 

V=Verde 

5 

4 

1 

1,00 

A=Albastru 

3,5 

1 

2,5 

6,25 

W=Alb 

3,5 

2 

-1,5 

2,25 

N=Negru 

6 

3 

3 

9,00 


Rezultate: 


N=6 

I D 2 =51 
R=0,35 

Rfo 5 = 0,829 

R‘ 0 % = 0,943 

==>Corelatie 

nesemnificativa 


e. Semnificatia coeficientului de corelatie Spearman 

La fel ca §i in cadrul coeficientului de corelatie liniara, coeficientul R poate fi 
comparat cu valori dintr-un tabel. 

- Ipoteza de zero: H 0 : R = 0 

- Test aplicat: test specific pentru R (coeficientul de corelatie al ragurilor). 

- Aplicatie: pentru un nivel de semnificatie a (0,05 sau 0,01) se cauta valoarea din 

tabel K,n = Kir 

Daca | R \ <R tab se accepta | H 0 \ §i se considera corelatia nesemnificativa, in caz 
contrar se respinge H 0 §i se considera o corelatie semnificativa a rangurilor. 

B. Coeficientul de corelatie Kendall 

Este tot un coeficient de corelatie pentru ranguri. 

a. Formula 

K 2S (II. 6.24) 

N(N - 1 ) 
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unde S este suma scorurilor pozitive §i negative ale rangurilor dintr-o clasificare in 
raport cu cealalta clasificare. 

b. Exemplul II.21.b: 

Rearanjam datele din tabelul II. 19. a. astfel incat o clasificare sa fie ordonata 
(de ex. cea pentru copii); datele apar acum ca in tabelul II.19.b. 

Deci S = -9 + 5= -4 §i inlocuind in (II. 6. 24) obtinem K = - 0,266. 

Exista tabele prin care se poate in continuare verifica §i semnificatia acestui coeficient 
de corelatie. 


Tabel II.19.b Rangurile preferintei culorilor - doua clasamente obtinute pe doua loturi: copii 
§i adulti - rearanjarea datelor din tabelul 7.1 


Culoarea 

Rangul 

Preferintei 

Notatie 

D(-) 

D(+) 


Copii 

Adulti 


r i < r j ,J>i 

r, > r p j ) i 

Ro§u 

Galben 

1 

2 

5,5 

5,5 

n 

r 2 

4 

V 3 ,r 4 ,r 5 ,r) 6 

0 

0 

Albastru 

Alb 

3,5 

3,5 

1 

2 

r 3 

r 4 

4(r 

3 9 r 4 ’ r 5 ’ r 6 ) 

3 < r 4’ r 5’ r 6 ) 

2 <r 5 ,V 

Verde 

5 

4 

r 5 

0 

0 

Negru 

6 

3 

r 6 

0 





«r 6 ) 



-9 

+5 


6.3. RELATII iNTRE VARIABILE NOMINALE 

Corelatia intre variabilele nominale nu se caracterizeaza prin coeficienti de 
corelatie ci se efectueaza prin aplicarea unui test statistic care sa indice prezenta / 
absenta unor corelatii intre clasificarile realizate dupa mai multe criterii. 


A. Testul de independents x 2 


Sub forma prezentata in capitolul 5, testul x 2 poate da informatii asupra corelatiei 
/ independentei intre clasificarile in cate doua clase, dupa doua criterii. 

Testul poate fi generalizat pentru m clase §i n criterii; in acest caz se utilizeaza 

mai des un coeficient de contingents C: 


C = 



(II. 6.25) 


Coeficientul C = 0 indica independenta variabilelor. Cu cat este mai mare, cu atat 
legatura este mai puternica (valoarea maxima C max = 1/42 = 0,707 )• 
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B. Alti indicatori 

Pentru variabile nominale sau propus §i alti indicatori care sS ilustreze posibile 
relatii intre clase: 

a. Indicatori de asociere 
- folosit pentru tabele de contingetS 2*2 

- formula: 

^ _ be - ad ? Q h q 2 totalurile pe linii, respectiv coloane 

V 

- (p g [-1, + 1]; valori extreme indicS asociere puternicS, valori in jurul lui 0 indicS 
independents 

- semnificatia statistics se determinS cu ajutorul repartitiei % 2 , statistica fiind calculatS 
cu formula: 

% 2 = N ■ cp 2 (II.6.26.b) 

b. Indicatori de grupare 

Prin diverse tipuri de analize se pot gSsi criterii dupS care indivizii unui lot se 
pot grupa in mai multe clase astfel incat sS se poatS preciza asemSnarea intre indivizii 
unei clase §i deosebirea lor fatS de indivizii altor clase. 


6.4. Relatii Intre mai multe variabile cantitative 

in cazul in care generalizSm analiza bivariatS, in care urmSream relatia intre 
variabilS (dependents) §i o variabilS independents, obtinem o analiza multivariata, in 


care avem o functie de mai multe variabile: 

y = f(x u x 2 ,...,x n ) (II. 6. 27) 

Cea mai simplS relatie este regresia liniara multipla, in care considerSm 
dependenta de forma: 

y = b 0 + + b 2 x 2 +. . . -+b n x n (II.6.28) 

Cea mai bunS suprafatS de regresie se obtine cand: 

Z = Zf / - y f = min (II. 6.29) 

unde y = b o ~\~bpc^ -\-b 2 x 2 -\-....-\-b n x n (II. 6. 28)’ 


Pentru regresia multipla se definesc: 

■ coeficientul de corelatie global 

■ coeficientii de corelatie partiali (luand pe rand fiecare pereche de 
variabile). 


7. EPIDEMIOLOGIE 

Epidemiologia este un domeniu medical pluridisciplinar avand o zonS de 
intersectie mare cu biostatistica. in epidemiologia clinicS se urmSre§te atat determinarea 
freeventei de aparitie a unei boli cat §i defmirea unor asocieri intre boalS §i factori 
cauzali sau favorizanti. Cand se suspecteazS vreo astfel de asociere, se incearcS la 
inceput sS se identifice conditiile care determinS cre§terea riscului unei afectiuni, apoi 
evidentierea unei relatii cauzS-efect, avand in final consecinte in dezvoltarea unui 
tratament adeevat §i a unor strategii profilactice. 
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Studiile epidemiologice intra in categoria studiilor populationale care cuprind 
doua mari capitole: 

- analiza riscului (partea centrala a epidemiologiei) 

- analiza supravietuirii 

7.1. Analiza riscului 


A. Factori de rise 

a. Definitie: O cauza ipotetica (indiferent de natura - comportament, conditie, 
caracteristica fizica sau de mediu etc.) ce determina cre§terea probabilitatii ca un individ 
sanatos sa dezvolte a anumita boala reprezinta un factor de rise. 

b. Clasificare: 

- factori de mediu: factori poluanti, toxine, microorganisme infectioase etc. 

- factori comportamentali (obiceiuri): fumat, alcool, droguri, nerespectarea masurilor de 
protectie a muncii, sedentarism etc. 

- factori sociali: evenimente familiare tragice, divort, pierderea serviciului etc. 

- factori genetici: hipercolesterolemie etc. 

c. Tipuri de expunere la actiunea factorului de rise: 

- expunere punctuala - ex. accidente (la o intreprindere chimica etc.) 

- expunere cronica - cea mai freeventa; se estimeaza in aceste conditii “doza” curenta, 
doza cumulata, durata expunerii etc. 

d. Relatia factor rise / boala: 

- factor cauzal - cand putem atribui factorului o actiune directa 

- factor favorizant (marker) care create probabilitatea, dar nu i se poate atribui o actiune 
directa (ex: factorii sociali - economici, educationali etc.). 


B. Prezentarea datelor 

Uzual datele din analiza riscului se prezinta sub forma unui tabel de contingenta, 
cel mai freevent 2x2 (cu doua linii §i doua coloane) in care intregul lot de N indivizi 
este impartit in grupul de indivizi expu§i (LI), respectiv neexpu§i (L2). Din fiecare 
grup, o parte dezvolta boala, (Nil din LI, respectiv N21 din L2), o parte nu (N12 din 
LI, respectiv N22 din L2) - tabelul 11.20 

Tabel 11.20. Prezentarea schematic^ a datelor unui studiu epidemiologic: E+ =expu§i, E- = 
neexpu§i la actiunea factorului de rise; B+ = prezinta boala, B- = nu prezinta boala 


Expunere 



B+ 

B - 


E+ 

Nil 

N12 

LI 

E- 

N21 

N22 

L2 


Cl 

C2 

N 


C. Metode de studiu in 
epidemiologie 

a. Studii experimentale 

Din punct de vedere teoretic rezultatele cele mai de incredere s-ar obtine intr- 
un studiu experimental, in care investigatorul are controlul complet asupra factorului de 
rise (ca variabila independents, cu rol cauzal) §i urmare§te efectul asupra grupelor 
(varibile dependente). Din considerente etice insa, aceste studii sunt limitate doar la 
actiunea unor factori cu rise redus. 
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b. Studii observationale 

In marea majoritate a cazurilor studiile trebuie efectuate pe loturi in care 
expunerea nu s-a intamplat la dorinta express a investigatorului. Marile dezavantaje ale 
studiilor observationale sunt: precizia limitatS a mSsurSrii actiunii factorului de rise 
(intensitate, duratS) §i stabilirea grupelor expu§i / neexpu§i ce vor fi comparate concret. 
Recunoa§terea §i “controlul” unor eventuale surse de “bias” constituie unul din 
elementele urmSrite prioritar in aceste analize. 

Dintre tipurile de studii observationale mai des intalnite enumerSm: 

i - Studiul transversal (“cross-sectional”) se mai nume§te §i studiu de 
prevalentS. Este cel mai simplu model, bazat pe fotografierea unei situatii la un moment 
dat, culegand date de tipul celor din tabelul 11.20. 

Dintre dezavantajele mai des citate retinem: 

- estimarea prevalentei este influentatS in cazul evolutiilor rapide (fie spre deces fie spre 
recuperare) 

- incertitudinea “antecedents - consecintS” 

ii - Studiul prospectiv pe cohorta (“cohort prospective”/”folow-up”/ 
“longitudinal”). Pornind de la numele unei unitSti militare in epoca romanS (cohorta), 
care oferea conditii asemSnStoare de luptS pentru membrii ei, studiile de acest tip iau in 
analizS douS loturi din persoane initial sSnStoase, dintre care unul este supus la actiunea 
factorului de rise suspectat. Loturile sunt urmarite in timp, pornind din momentul 
defmirii lor; se identifies aparitia afectiunii in ambele loturi. (figura II. 27. a) 

iii - Studiul retrospectiv pe cohorta (“historical cohort / retrospective / non- 
concurrent”). La fel ca in studiul prospectiv pe cohorts evolutia se urmSre§te in sensul 
natural al scurgerii timpului, pornind de la situatia unui grup initial din care o parte au 
fost expu§i §i acum putem evalua la cati din fiecare grup, a apSrut afectiunea analizatS 
(figura II. 27. a) 

iv - Studiul retrospectiv clasic (“case-control”) - in care grupul analizat 
cuprinde “cazurile” in care a apSrut boala §i investigSm in care din aceste cazuri a 
existat o expunere la factorul de rise (deci urmSrim in sens invers temporal) §i 
identificSm apoi prezenta/absenta factorului de rise §i pentru un grup martor (control) - 
figura II.27.b. Aceste studii “case-control”, de§i mai comode pentru colectarea unor 
date, au destule dezavantaje: grupul martor nu poate fi intamplStor ci trebuie selectat pe 
acelea§i criterii ca §i grupul de “cazuri”; de asemenea, dacS grupul B+ este selectat 
dintre cazurile spitalizate, el deja cuprinde un important bias : cazurile mai grave! 

c. Compararea metodelor 

O analizS a posibilelor surse de erori in diversele tipuri de studii ne permite o 
ierarhizare a metodelor enumerate, cele mai bune rezultate find a§teptate de la studiile 
experimentale; prezentarea ierarhicS a metodelor este schitatS in tabelul 11.21. 
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Tabel 11.21. Ierarhia metodelor de studiu in epidemiologie, functie de puterea acestora. 

experimental > cohort-prospectiv > cohort-retro spectiv > case-control > cross- 
sectional 


E+ 


E- 


< 

< 


D+ 

D- 

D+ 

D- 


Studiu cohort 
retrospectiv 
v ) 



trecut 


4 


Starea factorului de rise 


Timpul 


□ prezent 

Starea afectiunii 


expusi , 
neexpusi > 


afectiune prezenta 


expusi 


neexpusi ^ 


afectiune absenta 


Figura 11.27. Tipurile de studii epidemiologice - prezentarea schematica: (a) studii de tip 
cohort; (b) studii de tip case-control 


(b) 
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D. Parametri fundamental! in epidemiologie 


a. Indici in studii populationale 

i - Prevalenta unei boli intr-o populatie: este proportia din populatia respective avand 
boala (la un moment dat): 


Prv (B,t) = 

N 


Nr.indivizi avand boala B 
nr. populatie 


(II.7.1) 


ii - Incidenta unei boli: este numarul de cazuri ce apar intr-un interval At (ti ,t 2 ) intr-o 
populatie cu rise. Ea poate fi exprimata prin: 

. incidenta cumulative Cl: proportia intr-un grup fix predefmit (cohorta) la 
care apare boala in intervalul specificat (fig. 11.28). 

Cl (B At) = N inc (A t) nr. cazuri noi in A t q 

N nsc nr. populatie cu rise 


Pentru exemplul din figura 11.28. 

4 

Prv (1 ian.95 ) = 4 % 

100 


Cl 


7 (cazuri noi) 


100-4 (cazuri existente la momentul t 2 ) 


7 

96 


7,4% pe perioada de 1 an 


t^l ian. 1995) t 2 (31 dec. 1995) 

1 ::: 

2 --- 

3 ;;; 

4 ::: 

5 :: 

6 ::: 

7 ::: 

8 --- 

9 ;;; 
io- 
ii ::: 


Figura 11.28. Cazuri de hepatita B intr-un lot de 100 persoane: calculul indicelui cumulative 


*!-—-!■ 


” aparitia bolii 

stars itul bolii (sau scoatere din evidenta) 


. densitatea de incidenta ID (numita §i rata de incidenta, rata de hazard sau 
“forta” morbiditatii/mortalitatii): este data de numarul de cazuri noi ce apar intr-un 
interval At (ti,t 2 ) intr-o populatie cu rise, studiata pe diverse perioade de timp. intr-un 
studiu practic, pe o perioada indelungata, din lotul initial (tip cohorta) se pierd o serie de 
persoane din diverse motive (se muta, mor din alte motive , nu continua tratamentul 
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etc.). De aceea, cei care nu au fost prezenti intreaga perioada nu se scot din studiu ci vor 
fi luati in considerare numai in masura in care situatia lor a fost cunoscuta. 

ID (n _ N (Af) nr. cazuri noi in At q ^ 

N* risc nr. mediu populatie cu rise pe interval 


in figura 11.29 este prezentat un model de evidenta extins fata de cel din figura 

11.28. 


Din cohorta de 15 persoane cu rise (4 la 1 ian.1992, apoi 5 noi cazuri, 2 §i 
respectiv 4 noi cazuri la fiecare inceput de an 93-95), la 9 a fost depistata afectiunea 
(1,3,6,7,8,9,10,12,14), care a determinat decesul in 5 cazuri (1,7,9,12,14); 2 au 
supravietuit pana la incheierea studiului (3,6), 1 a fost pierdut din evidenta (8), iar unul 
a decedat din alte cauze (10). Din restul de 6 persoane cu rise studiate (2,4,5,11,13,15) 
la incheierea celor 5 ani de urmarire mai erau in evidenta 4 (5,11,13,15), unul a fost 
pierdut din evidenta (2) §i unul a decedat din alte motive (4). Numarul total de ani de 
rise pe intregul lot este suma coloanei din dreapta: 35,5 ani. Deci: 


ID 


9 

35.5 


0.25 cazuri/(persoana * an) 


Daca loturile sunt omogene se poate folosi cu aproximatie relatia: 

CI &ID x At (II. 7.4) 

De asemenea, se poate aproxima o relatia intre prevalenta §i incidental 
Prr & ID x AT (B) (II.7.5) 

unde AT (B) este durata medie a bolii. 

iii Rata de morbiditate (Mrb): este incidenta unei boli intr-o populatie, intr-un anumit 
interval de timp (adesea 1 an). 



* = in urmarire dmamtea 

incepeni studiului 

o = dernarar e a urrnarir n 
individual 

x = aparitia bolii (anul) 

A = deces 

# = pierderea din evidenta 

♦ = deces din alte cauze 

■ = supravietuitor la 
incheierea studiului 


Figura 11.29. Studiu de urmarire a evolutiei unui lot cu rise de cancer 


iv Rata de mortalitate: enumera cazurile de deces dintr-o populatie, intr-un anumit 
interval de timp; se utilizeaza: 

- rata de mortalitate generala: din orice cauza 

- rata de mortalitate specifica pe cauze: separat, pe boli sau grup de boli - (de 
exemplu: cardiovasculare etc.) 

- rata bruta de mortalitate: fata de intreaga populatie 

- rata de mortalitate specifica pe categorii: separat, pe anumite subgrupe de 
populatie 

- rata de mortalitate pe grupe de varsta 
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- rata de mortalitate corectata, pe grupe de varsta - se fac corectii in fimctie de 
distributia pe grupe de varsta. 

v Rata de fatalitate a bolii: rata de deces intr-o populatie avand boala, intr-un interval 
de timp. 

vi Rata de atac: pentru boli cu durata scurta, cand durata observatiei acopera intreaga 
“epidemie”, proportia celor ce dezvolta boala din populatia cu rise (= Cl). 


b. Parametrii in analiza riscului 

i - Indicele “odd” (suportul “succes / e§ec”): este probabilitaqtea de aparitie 
a bolii la cei expu§i fata de probabilitatea de a nu aparea boala la cei expu§i. Cu notatiile 
din tabelul 11.21 putem scrie: 

ODD (E+ ) = Nil /N12 (II. 7. 6) 

ODD (E -) = N21 /N22 

adica in cate cazuri prezenta factorului de rise (E+ = subiecti expu§i) are “succes” in 
declan§area bolii (Nil) fata de situatiile de “e§ec” (N12); similar raportul succes / e§ec 
pentru conditia absentei factorului de rise (E - = neexpu§i). 

ii - Raportul odds (“odds ratio”): este raportul indicelui “odd” pentru grupul 
expus fata de cel neexpus la factorul de rise: 

_ ODD(E+) _ Nil/ N12 _ NIVN22 (II.7.7) 

_ ODD(E-) ~ N21/N22 ~ N21-N12 


iii - Riscul relativ: este probabilitatea de aparitie a afectiunii la cei expu§i fata 
de probabilitatea de aparitie a afectiunii la la cei neexpu§i la factorul de rise. 


RR = 


Nil/ LI 
N21/L2 


(II. 7. 8) 


Daca riscul relativ are valoarea RR « 1 putem spune ca factorul analizat nu reprezinta 
un factor de rise, probabilitatea de aparitie a afectiunii fiind la fel de mare §i la lotul 
neexpus factorului de rise. Valori RR >1 dau o semnificatie actiunii factorului de rise. 
Pentru a estima intervalul de incredere in care parametrul RR poate fluctua intamplator 
se folosesc “limitele Cornfield” pentru p = 95% probabilitate ca ipoteza de zero sa fie 
adevarata. 

iv - Riscul atributabil: este diferenta intre probabilitatea de aparitie a bolii la 
cei expu§i §i cea de aparitie a bolii la cei neexpu§i. Formula este: 

AR = Nil /LI - N21 / L2 (II.7.9) 

in functia de tipul studiu efectuat se mai pot defini §i alti parametri pe care nu-i 
mai prezentam aid. 


E. Analiza multistratificata 

Deseori indivizii unei populatii sunt supu§i la actiunea simultana a mai multor 
factori de rise. Depistarea contributiei fiecarui factor de rise la efectul final se realizeaza 
prin analiza multistratificata. Se alcatuiesc tabele de forma celui din tabelul II. 22. a. 
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Tabel II. 22. a. Prezentarea datelor intr-un studiu cu doi factori de rise (fumat, cafea) 


| Lot: boala coronariana + 


Lot: boala coronariana - 


Subiect 

Fumat 

Cafea 
(mg / zi) 

Subiect 

Fumat 

Cafea - 
(mg / zi) 

1 

DA 

1100 

1 

DA 

1000 

2 

DA 

800 

2 

NU 

300 

3 

NU 

200 

3 

NU 

100 

12 

X = 716 


8/4 

12 

3/9 

X = 400 


O analiza superficial^ incomplete ne-ar putea induce ideea unui rise crescut al 
consumului de cafea asupra declansarii afectiunilor coronariene, conform centralizarii 
din tabelul II.22.b. 


Tabel 11.22. b. Influenta consumului de cafea in bolile coronariene 


Boala 

Consum zilnic mediu (mg) 

B + 

716 

B - 

400 


O stratificare incat sa se includa §i fiimatul, va scoate in evidenta rolul 
dominant al acestuia (tabel 11.22. c.). 

Tabel II.22.C. Tabel stratificat: consumul mediu de cafea / zi la fumatori §i nefumatori, respectiv 


coronarieni $i necoronarieni 


Fumat 

B + 

B - 

Medie 

DA 

950 (n = 8) 

1000 (n = 3) 

963 (n = 11) 

NU 

250 (n = 9) 

200 (n = 9) 

216 (n = 13) 

Medie 

716 (n = 12) 

400 (n = 12) 

558 (n = 24) 


Analizele multistratificate sunt destul de dificile; uneori este greu a discerne 
intre factorul cauzal §i alti factori asociati. Exista ni§te criterii definite de Hill care ar 
facilita aceasta operatiune. 

7 . 2 . Analiza supravietuirii 

Un succes indiscutabil al medicinei moderne il prezinta rezultatele 
tratamentelor in cazurile cu diagnostice severe. Depistarea precoce a afectiunilor grave 
§i largirea paletei §i eficientei tratamentelor au generart extinderea sensibila a sperantei 
de viata dupa diagnosticarea bolii. Estimarea eficientei unor terapii §i compararea 
tratamentelor se realizeaza prin studii epidemiologice. De§i pot fi retrospective, 
majoritatea studiilor sunt in general prospective, o serie de date necesare pentru analiza 
statistic^ nefiind disponibile pentru studiile retrospective. Capitolul din epidemiologie 
referitor la aceste studii, numit “analiza supravietuirii” §i-a extins sfera de aplicabilitate 
§i asupra altor tipuri de studii in care se urmare§te pe o durata mare de timp (luni, ani) 
rezulatatul unei terapii. 

Studiile de acest gen au fost initial solicitate de companiile de asigurari, 
ulterior devenind un capitol bine definit in epidemiologie. 


105 











Informatica Medicala & Biostatistica 


Metodologia acestor studii a fost standardizata, OMS publicand in 1974 
recomandarile UICC (“Union Internationale Contre le Cancer”): regulile TNM (tumori, 
noduli, metastaze). 

A. Caracteristicile studiilor de lunga durata 

Studiile recomandate sunt de tip “cohort prospectiv”, insa in cazul unor 
perioade indelungate (5-20 ani) apar o serie de factori de care trebuie sa tinem seama: 

- o serie de indivizi din lotul intial pot fi pierduti din evidenta (i§i muta 
domiciliul, intervin alte tratamente etc.); aceste “date lipsa” pot sa reprezinte uneori un 
procent insemnat din ansamblul de date; pentru prelucrari aceste cazuri nu se 
abandoneaza ci se iau in considerare, dar numai pentru intervalul de timp pentru care 
situatia individului este clar cunoscuta; 

- persoanele din lot traiesc in conditii diferite astfel incat aceasta heterogenitate 
face mai greu vizibil efectul datorat numai factorului de rise; 

- foarte des din ansamblul conditiilor putem desprinde unele care pot fi de 
asemenea considerate “factor de rise”, ce actioneaza sinergic sau competitiv cu factorul 
urmarit de noi. 

B. Prezentarea §i prelucrarea datelor 

a. Tabele de viata 

Metodologia OMS sugereaza colectarea datelor pentru prelucrare sub forma 
unor “tabele de viata” (“life tables”): 

Exemplu 11.22. Datele sunt redate in tabelul 11.23. lata descrierea coloanelor: 

1. Anul de observatie (i -M+l): se calculeaza numarul de ani de la data inceperii trata- 
mentului; de ex: un pacient care a fost prima data tratat in 7 aprilie 1947 §i a decedat in 
24 noiembrie 1950 va fi considerat decedat in intervalul 3-4. 

2. in viata la inceputul intervalului (li ): primul numar (1000) indica numarul total de 
pacienti studiati; nu inseamna ca toti au inceput tratamentul in aceea§i zi; ei sunt luati 
in evidenta pe masura ce sunt depistati §i incep tratamentul; in tabel intervalele se 
masoara pentru oricare pacient pomind de la ziua primului tratament. Numarul de 
indivizi cunoscuti a fi in viata la inceputul fiecarui interval (inceput de nou an de la 
luarea in evidenta) se calculeaza din precedentul scazand d i? Ui §i Wi , deci: 

/• +1 =l~ (d t + + w. ) (II. 7.9. a) 

3. Cei decedati (d t ) datorita bolii in intervalul i -hi + 1. 

4. Pierduti din urmarire (wj: aici se includ cei a caror situatie, la data incheierii studiului 
(31 decembrie 1960) nu este cunoscuta, insa pentru care este cunoscuta starea pana la 
un moment dat; de exemplu: un pacient care a inceput tratamentul in 20 Septembrie 
1946 §i era in viata pe 6 iunie 1949, dupa care nu se mai §tie nimic, va fi considerat 
pierdut in intervalul 2-3. Aici sunt de obicei inclu§i §i cei decedati din alte cauze. 

5. Sco§i din urmarire fiind in viata la sfar§itul perioadei analizate (w t ). in exemplul 
nostru perioada analizata se incheia la 31 decembrie 1960; un pacient care a inceput 
tratamentul in 5 mai 1954 §i este in viata la 31 decembrie 1960 va fi scos din calcul in 
intervalul 6-7 (a supravietuit 6 ani §i n-a fost urmarit mai mult). 

6. Numarul efectiv al celor expu§i la riscul de deces (rii). Pacientii pierduti din urmarire 
(Uf) §i cei sco§i din urmarire (w t ) sunt considerati ca fiind distribuiti uniform de-a lungul 
intregului an, ei pot fi considerati ca expu§i timp de jumatate de interval; deci: 

ft; = /; - ( //; + W; ) / 2 (II.7.9.b) 

S-a presupus ca probabilitatea de supravietuire pentru cei pierduti sau sco§i din urmarire 
este aceea§i ca §i pentru cei rama§i in evidenta. 
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7. Rata anuala de mortalitate (q ( ) reprezinta proportia celor decedati in fiecare an 
calculate ca probabilitate de deces: 

q t =d i /n j (II. 7.9. c) 

8. Rata anuala de supravietuire (p t ) reprezinta probabilitatea de a supravietui in 
intervalul i -ri+1 (calculate pentru cei in viata la inceputul intervalului): 

p. = 1 - q. (II.7.9.d) 

9. Rata cumulative de supravietuire de la inceput pana la inclusiv intervalul i -h i + 1 se 
calculeaza cu: 

i 

p=p/p 2 - p=Y\p i ^ IL7 - 9e ) 

7=1 


Tabelul 11.23. Prezentarea datelor pentru prelucrarea prin metoda actuariala sub forma de “tabele de viata”. 
Exemplul se refera la un studiu la pacienti care au inceput tratamentul intre 1946-1955 §i urmariti pana la 31 

decembrie 1960. (* din [UICC - TNM ]) 


1 

Anul de 

observatie 

i - i+i 

0-1 

1-2 

2-3 

3-4 

4-5 

5-6 

6-7 

7-8 




2 

In viata la 

inceputul 

intervalului 

li 

1000 

816 

642 

558 

504 

460 

382 

308 

259 

212 

165 

3 

Decedati in 
interval 

d; 

180 

170 

80 

50 

40 

28 

26 

7 

7 

11 


4 

Pierduti din 
urmarire in 
interval 

U; 

4 

4 

4 

4 

4 

6 

5 

4 

3 

3 


5 

In viata la 
sfar§itul 
intervalului §i 
sco§i din 

urmarire 

Wi 

- 

- 

- 

- 

- 

44 

43 

38 

37 

33 

165 

6 

Numarul 
efectiv de 

expu§i la 

riscul de 

deces 

Hi 

998 

814 

640 

536 

502 

435 

358 

287 

239 

194 


7 

Rata anuala 
de mortalitate 

9i 

0.180 

0.209 

0.125 

0.090 

0.010 

0.064 

0.073 

0.024 

0.029 

0.057 


8 

Rata anuala 
de 

supravietuire 

Pi= 

i-qi 

0.820 

0.791 

0.875 

0.910 

0.920 

0.936 

0.927 

0.976 

0.971 

0.943 


9 

Rata 

cumulativa de 
supravietuire 
pana la 

sfar§itul 
intervalului 

P;= 

Pl -P2 
■Pi 

0.820 

0.649 

0.568 

0.517 

0.476 

0.446 

0.413 

0.403 

0.391 

0.369 



Curbele de supravietuire se ridica pe baza acestor valori 

Aranjarea datelor sub forma unui tabel de acest tip este foarte convenabila in 
studiile de acest gen. 

b. Metoda actuariala 

Faptul ca practic nu dispunem de un lot pentru a incepe un studiu de tip 
“cohort-prospectiv” in analiza supravietuirii impune colectarea datelor pe masura ce 
apar node cazuri (vezi fig. 11.29.). Pentru efectuarea calculelor vom considera o noua 
origine a timpului - in exemplul anterior a fost data primului tratament; toate intervalele 
se calculeaza in functie de acest moment considerat 0 pentru fiecare individ. Metoda de 
calcul in functie de aceasta origine se nume§te metoda actuariala. 

Pentru rata cumulativa a supravietuirii se poate calcula §i eroarea standard 
conform relatiei lui Greenwood: 
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i= i «,.p. 

De exemplu, pentru n = 1 0 ani de supravietuire 
0,180 0,209 


(II. 7. 10) 


r 


S n = 0,369 




0,057 


= 0,017 


v 998 • 0,820 814- 0,791 194 • 0,943 y 

Deci cu nivel de incredere de 95%, intervalul pentru probabilitatea de a supravietui 10 
ani va fi: 


p 10 e (0,369 -2*0,017; 0,369 + 2*0,017) = (33,5% ; 40,3%) 

Tabelele de viata construite dupa modelul tabelului 11.23 sunt adaptate pentru metoda 
actuariala care este mai exacta decat a§a numita “metoda directa” in care apar doar 
rapoartele privind supravituirea pe un interval larg (5 ani, 10 ani). 


c. Corectarea ratelor de supravietuire 

Concluziile pentru interpretarea ratelor de supravietuire se obtin prin 
comparatie, fie intre diferite grupe de varsta, fie cu rata generala de supravietuire. in 
calcule pentru perioade indelungate sau cuprinzand §i pacienti mai in varsta este 
recomandabil a se face corectii in raport cu rata generala de supravietuire. 

Daca notam cu P 0 rata generala de supravietuire in populatia generala (grupele 
de varsta din care este extras lotul studiat), calculate in functie de decesele din toate 
cauzele, atunci rata corectata (intr-o prima aproximatie) pentru supravietuirea pe n ani 
este: 

P>PjP 0 (II.7.11) 

Valoarea lui p 0 se poate obtine pentru orice tara din tabele generale de mortalitate. 

d. Curbe Kaplan-Mayer 

Cea mai sugestiva forma de prezentare a rezultatelor unui studiu de 
supravietuire il constituie reprezentarea grafica, in fimctie de timp a ratei cumulate de 
supravietuire p f = f(i) sau a ratei cumulate de mortalitate q, = 1 - p t = g(i), cunoscute 
sub numele de curbe Kaplan-Mayer. in figura 11.30 sunt redate aceste curbe pentru 
exemplul din tabelul 11.23. 


e. Teste 

Pentru compararea a doua rate de supravietuire se pot folosi diverse teste 
statistice, (fie cele corespunzatoare compararii proportiilor, fie testele t sau Wilcoxon). 
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C. Aplicatii 

Analizele de tip actuarial, elaborate initial pentru companiile de asigurari au 
fost extinse pentru numeroase alte situatii ce implica urmarirea unei terapii: prelucrari 
dentare, implant cardiac, transplant de rinichi, diverse alte tipuri de protezare, etc. 

In ultimul timp s-au eleborat §i modele teoretice utilizate pentru simularea 
fenomenelor reale, in aceasta directie fiind cunoscut modelul lui Cox care folose§te o 
functie “hazard” pentru descrierea matematica a ratei de mortalitate, sau modelul 
Cormack - Me Kendrik pentru raspandirea epidemiilor. 
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Partea a Ill-a 

SEMNALE §1 IMAGINI 
BIO-MEDICALE 




1. PRELUCRAREA SEMNALELOR BIOLOGICE 


INTRODUCERE 

Unul dintre capitolele cele mai bine dezvoltate ale informaticii medicale ll 
constituie cel referitor la prelucrarea semnalelor biologice. Functionarea oricarui organism 
viu este insotita de o permanenta modificare in timp a unor parametri (bio)fizici §i 
(bio)chimici. Determinarea §i inregistrarea acestor parametrii a condus la rezultate 
§tiintifice importante, fiind elaborate o serie de metode de investigare bazate pe culegerea 
lor. 

Dezvoltarea deosebita a acestor metode este in buna masura §i datorata fmantarii 
unor astfel de cercetari de catre firmele producatoare de aparatura medicala. Astazi nici nu 
se mai produc electrocardiografe sau electroencefalografe fara modelul de prelucrare 
computerizata. in acest capitol vom trece in revista principalele aspecte referitoare la 
prelucrarea semnalelor biologice, pomind de la achizitia §i filtrarea semnalelor §i analizand 
apoi principalele tipuri de prelucrari ale semnalelor quasi-periodice (ECG) §i neperiodice 
(EEG). 


1.1. SEMNALE BIOLOGICE 

1.1.1. Definitie. Fazele prelucrarii unui biosemnal 

Dupa cum am mentionat mai sus, investigatia medicala modema cuprinde 
urmarirea evolutiei in timp a unor parametri (bio)fizici sau bio(chimici). Vom numi semnal 
biologic evolutia in timp a unei marimi biologice. 

Culese in forma lor naturala, semnalele biologice sunt insotite de o serie de 
zgomote pe care dorim sa le inlaturam, iar din semnalul astfel curatat dorim sa extragem 
informatia continuta de semnal reprezentata prin parametrii relevanti pentru a caracteriza 
procesul generator al semnalului §i care sa fie utili in decizia medicala. Putem distinge 
astfel principalelele faze ale prelucrarii unui semnal biologic (fig. III.l): 

- culegerea (achizitia) semnalului 

- prelucrarea (transformarea, reducerea) semnalului 

- calculul parametrilor caracteristici 

- clasificarea sau interpretarea semnalului, cu scop diagnostic. 

Primele doua faze se refera la "sintaxa" semnalului, adica depistarea 
componentelor elementare ale semnalului §i urmarirea succesiunii acestora iar ultimele 
doua se refera la "semantica" semnalului, adica semnificatia acestor componente 
(individual sau grupate). 


1.1.2. Clasificarea semnalelor biologice 

Sunt posibile mai multe clasificari ale semnalelor biologice, din diferite puncte de 

vedere. 

a) Dupa natura semnalului : 

- biosemnale electrice , de ex: 

= semnalul electrocardiografic ECG, datorat activitatii electrice a inimii 
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= semnalul electroencefalografic EEG, datorat manifestarilor electrice 
ale activitatii creierului 

= semnalul electromiografic EMG, datorat fenomenelor electrice ce 
insotesc activitatea musculara etc. 

- biosemnale neelectrice de ex.: 

= fonocardiograma, inregistrata din manifestarile sonore ce insotesc 
ciclul cardiac 

= semnalul Doppler, reprezentat de variatia frecventei ultrasunetelor 
reflectate de suprafete in mi§care etc. 

in principiu, orice marime biologica a carei evolutie in timp prezinta importanta 
(temperatura, pH, concentratia unor ioni etc.) poate fi considerate semnal biologic §i poate 
fi suspus unor metode de prelucrare cu ajutorul calculatoarelor. 


proces biologic 
generator de semnal 


(' j achizitia s emnaiuiui 


semnal digitizat 


(' j preiucrari ale s emnaiuiui 


semnal transformat 


(' j seiectia pjarametriior 


parametrii semnalului 


(' j dasificare 


semnal interpretat 


Figura. III. 1. Fazele prelucrarii semnalelor biologice. Cercurile reprezinta "forma" in care 
este prezentat semnalul intr-o anumita faza. Dreptunghiurile reprezinta fazele de prelucrare 

(tipuri de programe) 


b) Dupd evolutia in timp 

Semnale deterministe (comportarea semnalului la orice moment poate fi 
predeterminata) 

■ semnale periodice: semnale sinusoidale armonice (fig. Ill 2. a) 

■ semnale cvasiperiodice: (de exemplu ECG) in care o succesiune de evenimente 
se repeta cu o anumita periodicitate (fig.III 2.b) 

■ semnale tranzitorii: (de exemplu potentialul de actiune celular) care apare 
numai la stimulare; forma este aceea§i ori de cate ori repetam stimularea 

Semnale stochastice (sau aleatoare): - valoarea semnalului la un moment dat nu 
poate fi determinata din valorile in momentele anterioare. 

■ semnale stationare: (de exemplu EEG) in care anumiti parametri (de exemplu 
media) raman constanti (fig.III. 2.d) 
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semnale nestationare: (de exemplu EMG) in care §i parametrii statistici depind de 
timp (fig. III. 2.e). 



Figura III. 2. Clasificarea semnalelor biologice: deterministe: a, b, c, §i stochastice: d, e. 
Subdiviziuni: a: semnal periodic (unda sinusoidala); b: semnal cvasiperiodic (ECG); c: semnal 
transzitoriu (potential de actiune); d: semnal aleator stationar (fusuri alfa in EEG); e: semnal aleator 
nestationar (EEG). [Van Bemmel&Musen 1997] 


O categorie aparte de semnale o constituie a§a-numitele "trenuri de impulsuri" 
(procese punctiforme - ’’point processes”) in care nu ne intereseaza forma semnalului ci 
numai aparitia sau nu a unui impuls (exemplu: aparitia undelor R in semnalul ECG sau 
impulsurile nervoase pe axoni); aceste semnale se descriu prin a§a-numitele impulsuri 
Dirac - flinctii care au valoarea zero peste tot, exceptand intervalele foarte scurte in care 
apar evenimentele. 


1.1.3. Electrozi de culegere. Traductori 

Semnalele de natura electrica (ECG, EEG, EMG, etc.) reprezentand 
manifestari electrice ale fenomenelor studiate (ale inimii in EEG, ale creierului in EEG, 
ale mu§chiului in EMG) sunt culese cu ajutorul unor electrozi pu§i in contact cu tesutul 
analizat sau - cel mai adesea - pe piele in regiuni in care se proiecteaza aceste activitati 
electrice. De obicei ace§ti electrozi sunt confectionati dintr-un metal impolarizabil (Ag), 
acoperiti cu un tifon umezit cu solutie salina sau gel conductor, pentru a asigura un bun 
contact electric. Cel mai adesea ace§ti electrozi de culegere sunt mentinuti in pozitia de 
contact cu ajutorul unor benzi de cauciuc. Este bine a se acorda atentie fixarii acestor 
electrozi §i asigurarea unui contact bun pentru a evita o intreaga gama de artefacte 
posibile. Asistentele experimentate depisteaza rapid electrozii plasati incorect. Semnalul 
electric cules de ace§ti electrozi este filtrat §i amplificat fiind in continuare supus 
operatiilor de prelucrare. 

in cazul semnalelor care nu sunt de natura electrica ci de alta natura (mecanica: 
contractii, chimica: concentratii etc.), se folosesc dispozitive numite traductori care 
transforma semnalul original in semnal electric. 

Actualmente s-au realizat traductori care pot transforma in semnal electric 
aproape orice tip de marime: presiune, forta, temperatura, deplasare, pH, concentratia 
unei substante (in ultimul timp s-au realizat "biosenzori" pentru unele molecule 
organice) etc. Exista in momentul de fata o adevarata cursa pentru realizarea unei 
palete largi de biosenzori, pe de o parte pentru comoditatea de lucru comparativ cu 
metodele chimice (raspuns rapid, fara manevre suplimentare, suficient de precis), pe de 
alta parte pentru posibilitatea urmaririi in timp a parametrilor pentru o perioada mai 
indelungata de timp. 

Semnalele bioelectrice au in general valori foarte mici (milivolti, chiar 
micro volti) §i de aceea trebuiesc amplificate inainte de inceperea prelucrarii. 
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1.2. ACHIZITIA BIOSEMNALELOR 

1.2.1. Sisteme de culegere a biosemnalelor 

Dupa cum am mentionat mai sus, semnalele biologice pot fi culese in doua 

moduri: 

a) in cazul in care biosemnalul nu este de natura electrica se folosec traductori 
care transforma semnalul original in semnal electric. 

b) in cazul in care biosemnalul este electric se folosec pentru culegere ni§te 
electrozi de culegere care pot fi: 

- electrozi superficiali (de exemplu in ECG, EEG), care se aplica la suprafata 
tegumentelor; pentru a asigura o buna conducere electrica suprafetele unde se aplica 
electrozii (de obicei argintati, acoperiti cu tifon) se umezesc cu solutie salina sau gel salin. 

- electrozi-ac , de exemplu in EMG, in cadrul metodelor invazive. 


1.2.2. Conversia analog-numerica 

Semnalul cules §i amplificat se prezinta uzual ca o succesiune continua in timp a 
unor diferente de potential, fiind deci un semnal analogic. Pentru a putea prelucra un 
semnal cu ajutorul unui calculator numeric este necesar a transforma semnalul analogic 
(continuu), intr-o succesiune de valori numerice, care reprezinta un semnal numeric (sau 
digital). Transformarea se face prin "citirea" valorilor semnalului real (continuu) la anumite 
intervale de timp. 

Definitie. Transformarea unui semnal analogic ( continuu ) in semnal numeric 
discret (digital) se nume§te conversie analog-numerica (digitald). 

Deci descrierea numerica a unui semnal este o descriere discontinue (discreta). 
Daca intervalul de timp intre doua "citiri" succesive este suficient de scurt, descrierea este 
fidela. Realizarea conversiei analog-numerice cuprinde doua elemente fundamentale: 
esantionarea §i cuantizarea. Incadrarea convertorului analog-numeric (CAN) in schema 
de achizitie a unui semnal este prezenta in fig. III. 3. 



Figura III. 3. Plasarea convertorului analog numeric CAN in sistemul de achizitie a semnalului 
EEG intre pacientul P §i calculatorul K. Sistemul de conexiune a electrozilor E este legat de 
electroencefalograf EEG. Semnalul analogic exprimat de amplitudinea A(pV) functie de 
timp este "digitizat", devenind semnal numeric exprimat pe n biti. Daca s-ar folosi filtre, 
atunci filtrul analogic FA s-ar plasa inainte de CAN iar cel numeric FN dupa CAN 


a) Esantionarea semnalelor 

Operatia de discretizare a axei orizontale (abscisa) a unui semnal se nume§te 
e§antionare. Cum pe abscisa noi reprezentam timpul, putem spune ca e§antionarea 
reprezinta "citirea” semnalului la intervale discrete de timp. Putem astfel defini doua 
marimi caracteristice ale e§antionarii: perioada de e§antionare §i frecventa de 
e§antionare. 
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Perioada de e§antionare a unui semnal reprezinta intervalul de timp intre doua 
citiri succesive ale valorilor semnalului. Numarul de citiri ale semnalului in unitatea de 
timp se numepe frecventa de e§antionare. 

Daca notam perioada de e§antionare cu T e §i frecventa de e§antionare cu f e , atunci: 

f e =l/T e sau T e =l/f e ’ (III. 1) 

Cand perioada de e§antionare se exprima in secunde (s) obtinem frecventa de 
e§antionare in herzi (Hz). 



Figura III. 4. Conversia analog-numerica: e§antionarea §i cuantizarea, cu linie continua este 
reprezentat semnalul real; cu linie intrerupta este reprezentat semnalul e§antionat. 

Cunoa§tem doar valorile masurate in punctele de citire (la intervalele de timp date de 
perioada de e§antionare Te). Distanta Aq dintre doua trepte de amplitudine determina 
precizia citirii valorilor 

Un exemplu de e§antionare gre§ita a semnalului este prezentat in fig. III.5. stanga. 
Se observa ca perioada de e§antionare aleasa este prea mare; avem o variatie atat de rapida 
a semnalului incat ea va trece neobservata. De aceea, pentru a urmari semnalul real cu 
fidelitate trebuie sa alegem o perioada de e§antionare foarte scurta, deci o frecventa de 
e§antionare ridicata. Daca notam frecventa maxima a semnalului (numita §i frecventa 
Nyquist) cu f max atunci frecventa de e§antionare trebuie sa respecte conditia (111.2): 

f e >2*f max (HL2) 

Aceasta conditie se mai nume§te ’’teorema de e§antionare" sau teorema Shannon-Nyquist, 
care se enunta astfel: 

Frecventa de e§antionare trebuie sa fie cel putin dubla fata de frecventa maxima 
a semnalului. 

In figura III.5.dreapta s-a crescut frecventa de e§antionare §i nu se mai pierd 
detaliile privind variatiile semnalului. 
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Figura III. 5. Ilustrarea teoremei de e§antionare 


Am fi tentati sa credem ca este foarte bine sa luam o frecventa de e§antionare cat 
mai mare, insa aceasta cre§tere duce la achizitionarea unui numar ridicat de valori numerice 
pentru acela§i interval de timp, determinand o cre§tere substantial*! a timpului de prelucrare 
(fara a obtine totdeauna o cre§tere semnificativa a calitatii rezultatelor). De aceea frecventa 
de e§antionare se alege la dublul frecventei Nquist sau u§or peste aceasta valoare. 

Uzual se folosesc frecvente de e§antionare de 60-100 Hz (EEG), 250-500 Hz 
(ECG), pana la 1-10 kHz (EMG; potentiale evocate). 

b) Cuantizarea semnalelor 

Intervalul de valori cuprins intre valorile extreme posibile (minima §i maxima) ale 
semnalului se imparte intr-un numar N de trepte de amplitudine, astfel incat practic se 
citesc valorile corespunzatoare treptelor date de Aq (fig III.4). Cu cat numarul de trepte 
este mai mare, cu atat precizia de citire este mai buna. 

Valorile citite se exprima in sistem binar. De aceea, cel mai adesea numarul 
treptelor de amplitudine este o putere a lui 2. De exemplu, pentru 256 trepte, o valoare citita 
este exprimata pe 8 biti, caci 256 = 2 8 . Se obi§nuie§te sa se caracterizeze un convertor 
analog-numeric prin numarul de biti prin care se reprezinta o valoare citita. in majoritatea 
tipurilor de prelucrari intalnite la analiza semnalelor biologice se folose§te o reprezentare pe 
12 biti, (uneori sunt suficienti 8 sau 10 biti). Mai rar (potentiale evocate, EMG) se folosesc 
convertoare pe 1 6 biti. 

Relatia intre N - numarul treptelor de amplitudine (cuantizare) §i n- numarul de 
biti prin care se exprima valoarea citita de CAN este: 

N = 2 n (III.3) 

Putem astfel exprima sensibilitatea de citire a CAN, adica variatia potentialului de 
intrare care corespunde unei modificari de 1 bit a valorii citite. Aceasta sensibilitate se mai 
nume§te rezolutie de amplitudine sau precizie de citire sau cuanta de citire §i are valoarea: 


. Tr Vmax-Vmin 

AV = 

N 

unde: 


V max - V min 

V 


= Aq 


(m.4) 


V max , V min sunt valorile extreme posibile ale semnalului 

N - numarul de trepte de amplitudine (cuantizare) 
n - numarul de biti ai CAN. 
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1.2.3. Multiplexarea 

De obicei inregistrarea biosemnalelor se realizeaza folosind mai multi electrozi de 
culegere care se aranjeaza in diferite moduri numite derivatii, cel mai adesea standardizate. 
Fiecare electrod culege semnalul pentru un canal. Echipamentele de conversie analog- 
numerica permit inregistrarea pe mai multe canale folosind un singur convertor care este 
comutat pe rand la toate canalele cu ajutorul unui dispozitiv numit "multiplexor". In cadrul 
programelor trebuie sa se tina cont de intarzierea dintre citirile efectuate pe diferite canale. 
Exista §i multiplexoare care citesc valorile pe toate canalele aproape in acela§i moment (cu 
o frecventa de e§antionare foarte ridicata); dupa o pauza urmeaza o noua "salva" de citiri. 

1.3. SPECTRE DE FRECVENTA §1 FILTRARE 

1.3.1. Reprezentarea semnalelor 

Semnalele se pot reprezenta ca o functie de timp [ampl.= f(timp) - evolutia in 
timp a unei marimi] sau ca o functie de frecventa [ampl. = f(frecventa) sau putere = 
f(frecventa) - punand in evidenta compozitia semnalului]. Reprezentarile in functie de 
frecventa se numesc spectre de frecventa. Figura III. 6 arata spectrele de frecventa ale 
unor semnale periodice u§or de identificat (A, B §i C) §i a unui semnal neperiodic (D). 

1.3.2. FILTRAREA BIOSEMNALELOR 

Zgomote 

Semnalele bioelectrice au in general valori foarte mici iar actiunea de culegere a 
lor este insotita de culegerea unor zgomote care perturba (uneori foarte putemic) semnalul. 
Pentru a imbunatati raportul intre semnalul util §i zgomot, odata cu amplificarea semnalului 
se realizeaza §i o filtrare pentru eliminarea zgomotelor. Pentru a putea inlatura in mod 
specific zgomotele (partial sau total) sa urmarim o clasificare a lor. 

Clasificarea zgomotelor se poate face din mai multe puncte de vedere. 

a) Dupa evolutie : 

- zgomote (cavsi)periodice, numite §i zgomote "roz", in care sunt predominante 
anumite frecvente, 

- zgomote neperiodice, numite §i zgomote "albe” in care frecventele componente 
au aceea§i probabilitate. 

b) Dupa tendinta : 

- zgomote sistematice - de exemplu cele datorate unui electrod plasat 
necorespunzator, 

- zgomote intamplatoare. 

c) Dupa origine : 

- la culegere - datorate amplasarii nepotrivite a electrozilor sau unor contacte 
electrice nesatisfacatoare 

- la amplificare - majoritatea amplificatoarelor amplifica neuniform diferite 
domenii de frecventa; ponderea acestor zgomote este destul de redusa, aparatele modeme 
avand amplificatoare de buna calitate, 

- artefacte "bio" - se intampla uneori ca, pe langa semnalul dorit a se inregistra, sa 
fie culese §i alte semnale (de exemplu semnal electrocardiografic suprapus peste EEG sau 
artefactele de respiratie in inregistrarea ECG). 
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Figura III.6. Spectrele diferitelor tipuri de semnale: a) Un semnal sinusoidal cu frecventa/ = 

2 Hz §i spectral sau in A. b) Un semnal de 4,5 Hz cu amplitudine mai mica §i spectral sau in B. 
c) Semnalul rezultat din suprapunerea semnalelor din a) §i b); spectral sau in C cuprinde doua 
linii (cu linie intrerapta este prezentat spectral cand se prelucreaza un tronson mai scurt din 
semnal). d) Pentru un semnal neperiodic, spectral (D) este continuu. [Popescu 1988] 

Tipuri de filtre 

a) Dupa regiunea admisa (figura III.7) 

- filtru "trece sus” (fig.III.7.a) care lasa sa treaca toate frecventele f > f G 

- filtru "trece jos" (fig. III.7.b) care lasa sa treaca numai frecventele f < f 0 

- filtru "trece banda" (fig. III.7.c) care lasa sa treaca frecventele cuprinse intre 
doua limite: < f < f s 

- filtru "opre^te banda" (fig. III.7.d) are frecventele f < £ §i f > f s 

- filtru "ac" de tip "opre§te" (sau "trece") in care regiunea dintre cele doua limite f 
- f s este foarte ingusta; se utilizeaza in special pentru eliminarea perturbatiilor produse de 
posturile locale de radio; 

b) filtre analogice - filtre numerice : cele analogice sunt utilizate ca dispozitive 
fizice inainte de intrarea semnalului in convertorul analog-digital, in timp ce filtrele 
numerice se aplica semnalului deja digitizat (fig. III. 3 arata plasarea lor); 

c) filtre far a memorie - cu memorie : cele fara memorie au ca secventa de ie§ire o 
suma ponderata a unei perioade finite de intrare si au avantajul unei ie§iri identice pentru 
aceea§i intrare; filtrele cu memorie tin cont de un numar de ie§iri anterioare §i au avantajul 
de a folosi un numar redus de coeficienti pentru ie§ire, insa necesita o initializare; 

d) filtre nerecursive - recursive : in cazul filtrelor digitale calculul coeficientilor pe 
cale recursiva este redus; 
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Figura III.7. Tipuri de filtre - clasificare dupa regiunea admisa: anumite frecvente sunt 
lasate sa treaca, pe cand altele sunt inlaturate 


e) filtre generale - dedicate : cunoscand caracteristicile semnalului, raportul 
semnal-zgomot este imbunatatit in filtrele construite special pentru domeniul de frecvente 
§i amplitudini dorit, precum §i pentru tipul de unde; deoarece in multe semnale biologice 
apar atat fenomene mai lente, chiar filtrele special construite pentru un anumit tip de 
semnal pastreaza un caracter mai general; 

f) filtre invariante in timp - filtre adaptive : constructia unui filtru ale carui 
caracteristici frecventiale sa se adapteze semnalului necesita un semnal de referinta, care in 
unele situatii poate fi generat - fiind astfel posibil sa se suprime unele interference nedorite 
in semnal; 

g) filtre liniare - neliniare : se definesc in functie de relatia diferitelor componente 
in structura spectrala a semnalului de ie§ire, functie de cea de intrare. 

1.4. PRELUCRAREA SEMNALELOR CVASI - PERIODICE. 
SEMNALUL ELECTROCARDIOGRAFIC 

Semnalele cvasi-periodice, dintre care semnalul electrocardiografic (ECG) este 
cel mai reprezentativ, necesita o prelucrare in care se porne^te de la detectia perioadei, 
urmata de detectia unor evenimente in cadrul perioadei §i caracterizarea parametrica a 
undelor §i/sau intervalelor. 

1.4.1. Semnalul ECG 

Semnalul ECG reprezinta un semnal electric de mica amplitudine ce reflecta la 
nivel superficial activitatea electrica a inimii. Inima este un organ ce reprezinta un 
automatism functional. Declan§area unei revolutii cardiace incepe printr-o depolarizare a 
nodului sino-atrial care se propaga la nodul atrioventricular. Aceasta depolarizare este 
reprezentata in traseul ECG (vezi figura 111.8) prin unda P. Unda de depolarizare se propaga 
generand depolarizarea ventriculara reprezentata de complexul QRS, urmat de repolarizare 
reprezentata de unda T. in cazuri patologice se observa diverse modificari, prelucrarea cu 
calculatorul avand scopul de a create sensibilitatea sesizarii acestor modificari §i a realiza 
clasificarea lor. 
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Figurn III. 8. Traseul ECG normal 


1.4.2. Achizitia semnalului ECG 

Ca pentru orice semnal, conversia analog-digitala, conforma teoremei de 
e§antionare a lui Shannon, preia semnalul filtrat (in general filtre "trece" de banda 0,5-40 
Hz), apoi il e§antioneaza (actualmente se folose§te f e =250 - 500 Hz) §i il cuantizeaza pe 8, 
10 sau 12 biti. 

Rezultatele obtinute cu o frecventa de e§antionare constants sunt destul de bune, 
insa, datorita faptului ca ritmul cardiac nu este constant, se poate intrebuinta §i o frecventa 
de e§antionare adaptabila la ritm, astfel ca fiecare bataie a inimii sa fie impartita in acela§i 
numar de puncte. 

Dezvoltarea unor aplicatii care sa sesizeze toate abaterile posibile ale semnalului 
de la normal a concentrat insemnate eforturi, ilustrate intr-o bogata literatura consacrata 
acestei teme: 

- programe pentru interpretarea ECG in cele 12 derivatii 

- programe pentru vectocardiograme 

- programe pentru ECG §i VCG 

- pograme pentru ECG §i VCG in efort. 

1.4.3. Detectia perioadei 

In cadrul semnalelor (cvasi-)periodice este esentiala detectia perioadei - 
intervalul de timp dupa care se repeta acela§i ciclu de evenimente. 

Din punct de vedere functional perioada este defmita ca intervalul intre 
inceputul cascadei de evenimente care debuteaza cu depolarizarea nodului sino -atrial 
(inceputul undei P) §i inceputul urmatorului ciclu, adica intervalul intre doua unde P 
(fig. III.9). Unda P, avand amplitudine mica (0,1 - 0,2 mV), este detectata destul de greu 
de catre algoritmii utilizati in aplicatiile de prelucrare automata. De aceea aceste 
programe utilizeaza ca repere unde de amplitudini mari, de exemplu unda R (cca lmV). 
Se defme§te astfel perioada detectabila R-R. 
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Metoda uzuala de detectie se nume§te ’’metoda intersectiei de nivel". Se alege 
un nivel de referinta (de ex. 0.9 mV) §i se compara fiecare punct cu aceasta valoare; se 
retin indicele punctului la o prima traversare a nivelului §i cel al traversarii urmatoare. 
Cunoscand frecventa de e§antionare §i cei doi indici se calculeaza imediat intervalul de 
timp intre doua batai. 



Figura III. 9. Detectia perioadei prin metoda intersectiei de nivel 


Nivelul de intersectie trebuie ales corespunzator. Pentru a ft cat mai aproape de 
varful undei R s-ar recomanda o valoare ridicata, insa exista riscul de a “pierde” batai, 
deoarece nu toate varfurile R au aceea§i amplitudine (nivelul H in fig. III. 9). in plus, sa 
nu uitam ca este vorba de un semnal e§antionat §i rareori citim chiar valoarea de varf. 
Pe de alta parte, la coborarea nivelului de intersectie se reduce (pana la anulare) riscul 
de a “pierde” batai cardiace, dar apare riscul intersectiei cu unda T care ajunge uneori la 
aproape jumatate din amplitudinea undei R §i va fi deci interpretata ca o noua bataie 
(nivelul L in fig. III. 9). De obicei se estimeaza amplitudinea a cca 10 varfuri R 
succesive, §i se ia ca nivel de intersectie o valoare de 75-80% din media acestor varfuri 
(nivelul M in fig. III.9). 

in programele actuale detectia perioadei se realizeaza foarte exact. Exista 
numeroase programe care retin aceste perioade pe o durata indelungata facand posibila 
reprezentarea grafica a evolutiei pulsului pacientului. 

1.4.4. Etapele interpretarii ECG 

De§i programele enumerate difera prin unele caracteristici, toate urmaresc 
anumite elemente fundamentale, prin reducerea §i transformarea semnalului intr-un set de 
cativa parametri semnificativi pentru deciziile ulterioare. Etapele, indiferent de metodele 
specifice prin care se realizeaza cuprind: 

a) detectia complexelor QRS 

b) detectia artefactelor: 

- corectia liniei de zero 

- artefacte musculare 

c) tipificarea complexelor QRS 

d) tipificarea ST-T 

e) detectia undelor P 

f) selectia §i medierea ciclurilor 

g) recunoa§terea undelor 

h) recunoa§terea pattern- ului, cuprinzand: 

- extragerea parametrilor 

- clasificarea - programe de diagnostic. 

Majoritatea sistemelor utilizate divid prelucrarea in etapele mentionate, fiecare 
etapa reprezentand un modul program ce contine un set independent de subrutine. 
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Modulele sunt conectate la dispozitivul de stocare a datelor printr-o interfata software. 
Sistemele sunt, in general, independente de frecventa de e§antionare, care variaza intre 250 
§i 500 Hz. De asemenea, modulele trebuie sa fie independente de derivative analizate. in 
majoritatea cazurilor, cele 12 derivatii sunt impartite in 4 grupe de cate 3 derivatii culese 
simultan. 

1.4.5. Descrierea modulelor de prelucrare ECG 

Din punct de vedere al informaticianului, sarcinile ce trebuie rezolvate in 
prelucrarea ECG determina impartirea in module: 

1. introducerea datelor: este un modul ce dirijeaza convertorul la culegerea datelor, fie 
pe o banda magnetica, fie on-line de la pacient 

2. detectia QRS: este primul pas in toate sistemele; fiecare derivatie este inspectata 
pentru prezenta spike - urilor §i se determina un punct de referinta (’’punct fiducial”) in 
complexele QRS; este dificila separarea unui QRS de un artefact putemic in vecinatatea sa 

3. detectia artefactelor: in cazul depa§irii unor nivele, in unele derivatii, datele 
pot fi filtrate sau eliminate in cazul nivelelor de saturatie 

4. clasificarea QRS : complexele QRS detectate sunt grupate in familii, dupa forma 
undelor, stabilindu-se tipul dominant; se masoara §i fluctuatia intervalului intre complexe 
QRS succesive, utila in analiza ritmului; tot acum se evalueaza daca abaterile liniei de baza 
depa§esc un anumit nivel 

5. tipificarea ST: se detecteaza inceputul segmentului ST (punctul ”J” jonction), se 
compara intre ele segmentele ST - T ale complexelor QRS dominante §i se retin pentru 
mediere cele asemanatoare 

6. detectia undelor P: este cercetata activitatea atriala, detectandu-se undele P, atat 
cele la distanta fixa de QRS, cat §i cele la distanta variabila; se detecteaza §i flutterul atrial, 
daca este present 

7. modulul (< bataie”: cand s-au gasit suficiente complexe QRS cu segmente ST- 
T asemanatoare, se mediaza cu punctul de referinta gasit in detectia QRS 

8. durata QRS: se determina inceputul §i sfar§itul complexelor QRS mediate; 
aceasta se efectueaza pentru cele trei derivatii simultan in fiecare grup de derivatii 

9. durata P: se poate stabili numai daca distanta fata de inceputul complexului QRS 
este fixa; se efectueaza simultan in cele trei derivatii din fiecare grupare 

10. sfanptul undei T: stabilirea sfar§itului undelor T 

11 . parametrizarea: pentru fiecare derivatie se retin amplitudinea §i durata Q, R, S §i 
amplitudinile P, T (uneori §i alti parametri) 

12. ritmul : se realizeaza o clasificare a ritmului, conform datelor fumizate de modulele 
anterioare 

13. clasificare a conturului : se efectueaza atat pentru ECG cat §i in VCG; se utilizeaza 
adesea codul Minnesota §i programul de diagnostic stabilite de sistemele IBM §i Mayo 
Clinic 

14 . prezentarea rezultatelor: modulul de ie§ire cuprinzand unii parametri, graficul 
complexelor mediate §i diagnosticul. 

Dupa cum se observa, modulele 2, 3, 6, 8, 9, 10 se refera la probleme tipice de 
detectie, restul fund module de recunoa§tere a formelor (1 1 de tip extragerea atributelor, iar 
4, 5, 12, 13 de clasificare). 

1.4.6. Descrierea etapelor de detectie 

a) Detectia QRS poate fi efectuata prin algoritmi pentru cate o derivatie sau 
pentru mai multe derivatii. Cea mai uzuala tehnica detecteaza un prag stabilit. Semnalul 
original este filtrat (filtru trece banda), iar fiecare traversare a pragului intr-un anumit sens 
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este retinuta; se introduce apoi selectia, prin eliminarea traversarilor la intervale prea scurte 
fata de precedentele. 

O alta metoda, propusa de Udapa §i Murthy, utilizeaza descrierea sintactica a 
complexelor ventriculare §i supraventriculare pentru analiza ritmului. Se introduc 7 
simboluri pentru aprecierea fiecarui segment de e§antionare, conform pantelor (0, u§or, 
mediu sau putemic, pozitive sau negative); semnalul este transformat intr-o propozitie. Se 
defmesc gramatici pentru complexele ventriculare, care sunt recunoscute prin analiza 
sintactica (analiza propozitiilor). 

In cazul analizei simultane pe mai multe derivatii, in special in VCG, se defmesc 
vectori tridimensionali (in cazul a 3 derivatii) §i se introduce termenul de viteza spatiala 
pentru variatia vectorului; complexul QRS este detectat daca viteza spatiala depa§e§te un 
prag; deseori analiza pe mai multe derivatii utilizeaza intervalul de suprimare folosit in 
analiza pe o singura derivatie. 

Detectia QRS fiind o problema fundamentals in analiza semnalului ECG, 
programele sunt in continua imbunatatire, ajungandu-se in momentul de fata ca numarul 
erorilor (QRS fals pozitive §i fals negative) sa fie destul de redus. 

b) Detectia artefactelor. Calitatea semnalului de intrare este o conditie esentiala 
pentru interpretarea traseului, indiferent daca este efectuata de om sau computer. 
Artefactele traseelor inregistrate pot fi impartite in 5 categorii, fiecare cu caracteristicile 
sale: 

- devierea liniei de baza 

- interferenta frecventei retelei de curent 

- artefacte musculare 

- spike- uri 

- saturatia de amplitudine prin modificari bru§te ale liniei de baza. 

Fiecare tip de artefact necesita metode specifice de detectie §i corectie. 

. devierea liniei de zero este o perturbatie de joasa frecventa, datorata respiratiei sau 
mi§carii pacientului. Aceste devieri sunt imprevizibile §i deci greu de corectat. Sunt 
posibile mai multe cai de corectie, cea mai uzuala fiind metoda lui Riedl. Din semnalul 
e§antionat se selecteaza fiecare al 20-lea punct (care poate apartine fie liniei de baza, fie 
unei unde); se elimina punctele cu variatii mari fata de cele vecine §i se neteze§te curba, 
obtinandu-se profilul liniei de baza, ce va fi considerate linie de zero; prin scaderea ei din 
semnalul original se obtine semnalul corectat (fig.III.10); 

. interferenta frecventei retelei este o perturbatie previzibila §i corectia se poate efectua prin 
filtrare. Este, totu§i, important de remarcat ca unele componente din complexul QRS se 
situeaza in acela§i domeniu de frecvente cu frecventa retelei de alimentare §i astfel se 
produce o perturbare nedorita a semnalului original. Mortara a descris o tehnica neliniara 
de estimare a interferentei retelei, bazata pe predictia semnalului la momentul ulterior; este 
astfel posibila o filtrare numerica, dar complexele QRS pot fi afectate §i in aceasta situatie; 

. artefactele musculare au un spectru mai larg de frecventa §i apar, de regula, in 
inregistrarile in timpul efortului; o filtrare de joasa frecventa reduce, in general, contributia 
lor la distorsionarea semnalului; 

. spike-urile, prin durata lor, deosebit de scurta, pot fi recunoscute mai u§or §i eliminate 
printr-o procedura de comparatie cu punctele vecine; la frecvente de e§antionare mai mici, 
exista pericolul de confrizie cu componentele QRS; 
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Figura III. 10. Exemplu de corectie a liniei zero. [Popescu 1988] 


. saturarea in amplitudine este tot o deviere a liniei de baza, insa brusca; corectia se face 
similar, introducand conditia de eliminare prin comparatia mai multor puncte vecine; in 
general, prin aceasta corectie se pot pierde unele complexe QRS, deci zonele corectate se 
eticheteaza. 

c) Tipificarea QRS : de§i este in mare masura o problema de recunoa§tere a 
pattern- ului, (fig. III. 11) are unele aspecte specifice: 



- alinierea complexelor QRS inainte de extragerea atributelor este necesara daca la 
detectie s-a utilizat direct amplitudinea semnalului §i nu derivata sa; alinierea se realizeaza 
prin modificarea pozitiei relative a intregului complex in raport cu punctul de referinta 
(metoda utilizata este maximizarea coeficientului de corelatie intre complexe); 

- alegerea parametrilor pentru extragerea atributelor ofera o paleta larga de 
posibilitati privind punctele de calcul ale amplitudinilor §i duratelor. Diferitele programe 
enumerate la inceputul paragrafului utilizeaza seturi variate de atribute, folosind fie valori 
culese, fie valori de interpolare; se sustine adesea ca o frecventa de e§antionare ridicata 
(500 Hz) ar deveni preferabila prin calitatea oferita in aceasta prelucrare. 

d) Tipificarea ST - T este, de asemenea, o problema abordabila in stilul clasic al 
recunoa§terii pattern - ului (fig. III. 12). 


126 







D. Lungeanu, Gh.-I. Mihala§ 


R 


1 



f \ 

!\ 






normal subdeni velat supradenivelai descendent ascendent 


Figura III. 12. Variante de segmente ST. [Popescu 1988] 

Situatii mai deosebite apar cand corectia liniei de baza a fost insuficienta; ele pot 
fi lesne confundate de computer cu modificari ale conductiei ventriculare. Totu§i, daca 
pentru mediere au ramas suficiente segmente ST -T, zgomotul introdus este in mare masura 
suprimat. 



Figura 111.13. Exemplu cuprinzand pasii de prelucrare a functiei de autocorelatie pentru 
detectia undelor flutter. [Popescu 1988] 
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e) Detectia undelor P este una dintre cele mai dificile probleme in analiza ECG 
sau VCG, in literatura existand inca unele neconcordante de terminologie, detectia undelor 
P fiind uneori considerate ca determinare a inceputului §i sfar§itului undei P, care fiind o 
unda de mica amplitudine poate fi u§or confundata cu un zgomot. Este mai rezonabil a 
cauta intai prezenta undei §i apoi a-i delimita marginile. 

Sunt detectabile 3 tipuri de activitati atriale: 

- unde P urmate de complexe QRS la intervale fixe, numite unde P cuplate; in 
aceste cazuri timpul de conducere atrio-ventriculara este aproximativ constant 
(variabilitate de maximum 30 ms) - ritmul sinusal 

- unde P ce nu sunt intotdeauna urmate de complexe QRS, sau distanta este 
variabila, ca in cazurile de bloc atrio-ventricular de gradul 2 

- unde flutter , definite ca oscilatii regulate bifazice, uniforme, cu frecvente intre 
200-400 pe minut; nu se evidentieaza o linie de baza. 

Daca nu apare nici unul din tipurile descrise, abaterea de la normal va fi decisa de 
modulul de clasificare a ritmului; astfel de situatii apar in fibrilatia atriala sau ritmurile 
nodale. 

Un exemplu privind pa§ii de prelucrare pentru detectia undelor flutter prin functia 
de autocorelatie este redat in fig. III. 13. Metoda este descrisa in paragraful privind analiza 
temporala a semnalului EEG. 

f) Selectia de mediere a ciclurilor. Aproape toate sistemele de prelucrare 
utilizeaza un set de masurari pentru partea de diagnostic, care sa reprezinte caracteristicile 
complexului PQRST dominant. Este posibil ca parametrii finali sa fie calculati pentru mai 
multe cicluri dominante §i sa se medieze parametrii sau ca din ciclurile dominante sa se 
alcatuiasca un ciclu reprezentativ din care sa se extraga parametrii. 

in continuarea prelucrarii, se definesc atributele ce vor fi extrase pentru 
prelucrarea prin metoda recunoa§terii pattern- ului (va fi descrisa in paragraful privind 
analiza semnalului EEG). 

Prevalenta bolilor cardio-vasculare explica eforturile considerabile depuse pentru 
elaborarea programelor care au ajuns deja la un grad inalt de fiabilitate. Din cercetarile 
efectuate pana in prezent, se desprind urmatoarele concluzii: 

- algoritmii sunt mai performanti in VCG decat in ECG standard cu 12 
derivatii; s-ar imbunatati performantele in ECG daca s-ar modifica derivatiile de 
inregistrare, astfel incat sa se obtina 4 grupari de cate 3 derivatii ortogonale 

- ar fi necesare imbunatatiri la detectia artefactelor, in special a spike- urilor, care 
introduc detectii fals pozitive 

- in partea de pattern-recognition ar fi necesare imbunatatiri ale modulelor de 
diagnostic, insa aceasta nu tine de algoritmii de prelucrare ci de criteriile general acceptate 
de comunitatea medicala, a carei orientare spre utilizarea tehnicii de calcul va imprima 
reconsiderarea unor defmitii, clasificari §i abordari. 

1.5. ANALIZA SEMNALELOR NEPERIODICE. PRELUCRAREA EEG 

Semnalele neperiodice reprezinta cel mai des intalnit tip de semnal biologic, 
iar metodele de prelucrare au un caracter general. De aceea, de§i vom alege semnalul 
EEG ca exemplu tipic de semanal neperiodic, multe din metodele de prelucrare descrise 
in continuare se pot aplica §i altor semnale. 

1.5.1. Caracterele generale ale semnalului EEG 

Semnalul electroencefalografic reprezinta activitatea electrica a creierului §i este 
inregistrat in diferite pozitii ale electrozilor de culegere pe scalp. Amplitudinea variaza intre 


128 




D. Lungeanu, Gh.-I. Mihala§ 


10 §i 200 |uV iar frecventa intre 0,5 §i 30 Hz. Neperiodicitatea este o caracteristica vizibila 
§i pentru un ochi neavizat. 

Originea semnalului este inca o problema neelucidata. De§i a existat §i opinia ca 
rolul preponderent 1-ar avea regiunile profimde ale creierului, actualmente se considera ca 
electrozii culeg in special activitatea scoartei, semnalul pe fiecare electrod reprezentand o 
sumare ponderata (dependents de distanta la electrod §i de mediile intermediare) a 
activitatilor unei regiuni relativ intinse. Experience efectuate prin deplasarea electrozilor 
in regiuni invecitate au dus la concluzia ca nu ar fi posibila o delimitare externa precisa a 
diferitelor regiuni. Pentru a putea compara diferite trasee, s-au standardizat unele variante 
de amplasare a electrozilor, precum §i conditiile tehnice de inregistrare. (Din pacate exista 
inca mai multe standarde). 

Activitatea EEG inregistrata cuprinde mai multe elemente cu diferente regionale 
§i cu evolutie dinamica, ceea ce ridica numeroase dificultati de prelucrare, dar totodata 
incita curiozitatea §tiintifica de a gasi originea acestor variatii, cu scopul ca apoi sa poata fi 
utilizate (de exemplu, in scop diagnostic) sau chiar controlate (terapie). lata o clasificare a 
activitatilor EEG efectuata de Dumermuth: 

a) Activitate spontana neparoxistica: 

■ activitati fara modificari temporale semnificative (alpha, beta, ritm lent continuu, 
activitate lenta polimorfa) 

■ activitati cu modificari lente in timp (activitate in somn, activitate postictala, 
activitate fluctuanta in coma, activitate de hiperventilatie, descarcari seizure ) 

■ activitati de tip intermitent (activitate sigma in forma de spindles de somn, ritmul 
miu, ritmuri lente intermitente, diferite pattern- uri psihomotorii). 

b) Activitate spontana paroxistica: 

■ varfuri, unde ascutite 

■ complexe varf - unda 

■ formatii ritmice (3/sec) varf §i unda 

■ unde lente paroxistice 

■ varfuri pozitive 

■ complexe SSLE 

■ complexe K §i potentiale vertex in somn. 

c) Activitate evocata: 

■ potentiale evocate tranzitorii 

■ insu§irea fotica a ritmului 

■ activitate la de§teptare 

■ efectele de inchidere a ochilor 

■ undele X. 

in mod uzual un medic de explorari fimctionale, in interpretarea pe care o da 
unui traseu EEG utilizeaza o terminologie specifica: de exemplu “traseu iritativ (unde 
mai ascutite), cu frecvente fusuri alfa, supravoltat (amplitudini mai mari) etc”. Prin 
metodele de prelucrare se vor putea estima prin valori numerice caracteristicile uzuale 
adaugandu-se §i o serie de parametri noi. 

in ciuda faptului ca eforturile depuse pentru analiza semnalului EEG acopera o 
paleta larga §i variata de metode, rezultatele obtinute pana in prezent sunt relativ 
modeste, insa acest domeniu este deosebit de dinamic aparand mereu metode noi. 
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1.5.2. Clasificarea metodelor de prelucrare 

Complexitatea semnalului a determinat aparitia unui numar mare de posibilitati 
de abordare a prelucrarii, fiind impartite in doua mari categorii: 

metode elementare de analiza 
metode integrative. 

Metodele elementare de analiza pot fi divizate la randul lor in doua mari clase, 
dupa aspectul preponderent urmarit in prelucrare: 

prelucrari in domeniul timp (analize temporale); 
prelucrari in domeniul frecventa (analize frecventiale). 

1.5.3. Metode elementare de analiza. Analiza temporala a semnalului EEG 

Analizele temporale cuprind tehnici de prelucrare care presupun ca element 
fundamental secventa temporala a datelor, orientate pe cate o caracteristica particular^ a 
semnalului. in exemplele care urmeaza in acest paragraf ne vom referi, in general (cu 
exceptia cazurilor ce vor fi mentionate), la semnalul prezentat in fig. III. 14, inregistrat in 
derivatia centro-occipitala stanga, pe un subiect sanatos. 



Figura III. 14. Portiune de traseu EEG; imagine realizata de programul de vizualizare. 

[Popescu 1988] 


a) Analiza amplitudinilor (Drohocki) consta in estimarea unei functii de 
distributie a amplitudinilor §i parametrilor statistici asociati ei. Este utila pentru rezumarea 
datelor EEG pe perioade lungi §i pentru caracterizarea activitatii spontane, astfel incat sa 
poata fi detectate §i evenimente paroxistice. 

Principala forma de prezentare a rezultatelor analizei amplitudinilor este 
histograma amplitudinilor (fig. III. 15a). O distributie mai ascutita decat cea normala ar 
caracteriza un semnal “subvoltaf ’ (cand majoritatea valorilor sunt mici, in apropierea liniei 
de zero) in timp ce o distributie mai turtita ar corespunde unui traseu ce uzual ar fi fost 
numit ‘‘supravoltaf ’. 

b) Analiza intervalelor (perioadelor) (Saltzberg §i Burch), ce reprezinta un studiu 
al distributiei intervalelor intre “punctele specifice”, cum ar fi: traversarea axei (zero 
crossing ), extreme, puncte de inflexiune, etc (fig. III. 15b). Se evalueaza perioade 
(intervale) §i pe prima §i a doua derivata a semnalului. De§i metoda este simpla, rezultatele 
s-au dovedit a fi in foarte buna concordanta cu cele obtinute prin metode mult mai 
sofisticate atunci cand in semnal este prezent un ritm dominant. 
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Figura III. 15a. Histograma amplitudinilor, impartind intreaga plaja de valori de intrare a 
semnalului (-200pV, + 200pV) in 40 clase de valori (a cate 10 pV fiecare) 

Cand sunt prezente mai multe frecvente, metoda poate conduce la interpretari eronate. 
Frecventele joase influenteaza putemic linia de zero, ceea ce determina erori in special ale 
frecventelor inalte. Adaugand insa §i analiza primelor doua derivate, se inlatura unele erori, 
dar frecventele joase tot nu sunt detectate suficient de bine. 



Figura III. 15b. Intervalele de traversare a axei de catre semnal; pentru semiunde se utilizeaza 
intervalele cu indici pari (i 0 , i 2 , ...), pentru unde intregi, intervalele cu indici impari (ii, i 2 , ...) 

Analiza intervalelor, prin simplitatea sa §i viteza mare de calcul este potrivita pentru studii 
multicanal sau prelucrari de lunga durata. A fost utilizata pentru analizele EEG in timpul 
somnului, pentru monitorizari §i in psihofarmacologie pentru a determina profilul 
modificarilor induse de diferite medicamente. 

c) Analiza intervale amplitudini (Marko §i Petsche), s-a dezvoltat in mai multe 
variante. Cea mai simpla este o analiza a intervalelor, la care se adauga §i informatii privind 
amplitudinea semnalului, utilizate pentru monitorizare in timpul anesteziei §i operatiilor 
(Pronk 1975) §i pentru selectia automata a epocilor fara artefacte de inregistrare 
(Matousek). 
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Cea mai uzuala varianta, numita §i analiza secventiala (Demetrescu), Hamer §i 
Ostemgren consta in masurarea lungimii de unda §i amplitudinea de la varf la varf a 
fiecarei unde definite prin trecerile axei. 

O alta varianta intalnita mai frecvent §i numita detectia varfurilor masoara 
amplitudinea de la varf la varf a fiecarei unde §i perioadele intre amplitudinile extreme (de 
fapt traversari ale axei pentm prima derivata a semnalului). Se apreciaza ca aceasta metoda 
este cea mai apropiata de modul in care un EEG-ist cite§te o electroencefalograma. Metoda 
e mai robusta in cazul variatiilor liniei de zero, insa foarte sensibila la zgomot de frecventa 
mare, care introduce numeroase oscilatii marunte ale undei; se impune in aceste analize o 
buna filtrare a frecventelor mari §i o “netezire” a semnalului inainte de prelucrare. 

Se observa ca aceste analize au ca problema majora defmirea exacta a unei unde 
sau semiunde, unele variante fiind foarte sensibile la frecvente joase, altele la frecvente 
inalte. Au fost propuse §i variante combinate, utilizandu-se analiza intervalelor pentru unde 
cu amplitudini mari §i frecvente joase, impreuna cu detectarea varfurilor pentm undele cu 
amplitudini mici §i frecvente mari (Lim §i Winters). Tot o forma a detectiei varfurilor este 
§i detectia infa§uratoarelor semnalului (Schenk), linia zero fiind considerate media intre 
infa§uratoarea inferioara §i cea superioara. Un aspect interesant al acestor metode il 
constituie posibilitatea reprezentarii grafice a fiecarei unde ca un punct in sistemul de 
coordonate amplitudine-interval (lungime de unda), fiind posibila §i medierea in timp real 
pe mai multe benzi de frecventa §i pe mai multe canale deodata, obtinandu-se harti 
topografice ale activitatii EEG. 

d) Analiza corelatiei (Barlow §i Brazier) compara un tronson (o epoca) a 
semnalului cu un alt tronson, fie al aceluia§i semnal (autocorelatie), fie al unui semnal cules 
pe un alt canal (intercorelatie). Compararea se realizeaza prin deplasarea in timp a 
tronsonului comparat fata de cel de referinta §i efectuarea produselor tuturor perechilor de 
valori. Se obtine, astfel, o frmctie (in raport cu “deplasarea in timp”) ce evidentiaza 
componentele periodice ale unui semnal (sau doua semnale). 

Functia de intercorelatie, prin capacitatea sa de a detecta decaljul cu care apar 
unele unde in anumite regiuni, este utila in determinarea originii anumitor unde EEG, in 
special a unor focare de epilepsie, care pot fi astfel localizate destul de precis. 

Functia de autocorelatie poate fi utilizata pentm obtinerea transformatei Fourier a 
semnalului, care reprezinta deja o prelucrare frecventiala. 

in figura III. 16 este prezentata functia de autocorelatie a semnalului luat ca 
exemplu in fig. III. 14. 
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Avand o foarte solidS fundamentare matematicS §i fiind §i strans legatS de analiza 
spectralS, analiza corelatiei este utilizatS ca un instrument de referintS pentru celelalte 
metode. Exists sisteme analogice (corelatoare) care ralizeazS automat analiza corelatiei 
(atat auto- cat §i intercorelatia). 

1.5.4. Analiza spectrala 

Punctul de plecare al analizei spectrale este ipoteza ca un semnal periodic 
complex poate fi considerat ca suprapunere a unor semnale periodice simple (de exemplu, 
sinusoidale), cu diferite frecvente, amplitudini §i faze initiate. Se obtine astfel din functia 
semnal o functie spectru reprezentand o distribute in domeniul frecventS s(f). Ipoteza s-a 
generalizat §i pentru semnale neperiodice, obtinandu-se, in general, un spectru continuu al 
semnalului. in functie de mSrimea reprezentatS in spectru se disting spectre de amplitudine 
sau spectre de putere (in care intervine pStratul fimctiei semnal). 

a) Consideratii teoretice. Exista mai multe posibilitSti de alegere a fimctiilor 
periodice simple dupS care sS se facS descompunerea, insS cea mai uzualS descompunere 
este dezvoltarea in serie Fourier, care considers ca semnalul ar rezulta prin suprapunerea 
unor sinusoide 

( k=l,2 , ...) cu diferite amplitudini (M k ), frecvente (f k ) §i faze ( (fa) : 

OO 

x(t ) = M 0 + E M k cos^ • n • fk • t - cp k ^ (m.5) 

k = 1 

Pentru un semnal sinusoidal spectrul este o linie, pentru un semnal periodic 
oarecare este un grup de linii. Deoarece analiza cuprinde intotdeauna o portiune finita de 
semnal, liniile din spectrul calculat nu mai sunt foarte inguste, latimea liniilor fiind 
dependents atat de durata inregistrarii, cat §i de perioada de e§antionare a semnalului. in 
cazul in care semnalul este neperiodic, spectrul este continuu, iar suma din relatia (111.5) 
devine integrals, in fig. III. 16 au fost prezentate cateva tipuri de semnale impreunS cu 
spectrele lor. 

incS de la inceputurile electroencefalografiei, in semnalele culese au fost distinse 
diferite ritmuri fundamental (delta: 0,5 - 3 Hz, theta: 3-7 Hz, alfa: 8-12 Hz, beta: 16 - 
22 Hz), insS datoritS suprapunerii lor este dificil a se aprecia din ochi ponderea fiecSrui 
ritm. Aceasta explicS §i interesul deosebit acordat acestui tip de analizS, cu o solidS 
fimdamentare matematicS (analiza spectralS se utilizeazS §i in tehnicS in studiul vibratiilor, 
precum §i in electronics). 

Prin analiza spectralS se calculeazS componentele spectrale, adicS ponderea pe 
care o au diferite frecvente care prin suprapunere ar genera un semnal similar cu cel 
analizat. Graficul care se obtine se nume§te spectru, mSrimea reprezentativS de obicei fiind 
“densitatea spectralS de putere”. 

b) Alegerea parametrilor de prelucrare a semnalului real 

in toate cazurile reale semnalul este de duratS limitatS AT (de ordinul secundelor); 
durata tronsonului preluat se mai nume§te §i “epocS”. Acest interval AT determinS 
rezolutia spectrala Af, adicS distanta minimS intre douS linii spectrale (“finetea” de 
reprezentare a spectrului care se intinde intre 0 §i f max (F NY - recventa Nyquist). Relatia intre 
Af §i AT este: 

Af = 1/AT (III.6) 
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Conform acestei relatii observam imediat ca, pentru a obtine o rezolutie spectrala 
satisfacatoare (preferabil sub 1Hz), avem nevoie de epoci destul de lungi, ceea ce inseamna 
achizitionarea unui numar ridicat de puncte, deci §i cre§terea duratei de prelucrare. 

Frecventa de e§antionare f e §i durata AT a unei epoci prelucrate (lungimea 
tronsonului) determina structura spectrului obtinut. Deoarece semnalul EEG spontan nu 
intereseaza, in general, frecventele mai mari de circa 30 Hz (F Ny ), rezulta ca frecventa de 
e§antionare trebuie sa fie f e > 60 Hz. insa, in aceste situatii, semnalul trebuie sa fie bine 
filtrat, inlaturandu-se toate frecventele f > f max in caz contrar apare fenomenul numit 
aliasing, adica frecventele superioare sunt interpretate ca frecvente joase §i nu exista nici 
un procedeu de a inlatura acest fenomen dupa e§antionare. in cazul in care semnalul nu este 
bine filtrat, este preferabil sa se lucreze cu frecvente de e§antionare mai ridicate (in dauna 
timpului de rulare). 

in cazul unui semnal aleator, variabilitatea spectrului nu scade la cre§terea duratei 
inregistrarii, astfel incat pentru marirea reproductibilitatii se utilizeaza neteziri ale 
spectrului sau chiar medieri ale spectrelor obtinute pe perioade succesive mai scurte. 
Trebuie remarcat ca spectrul obtinut printr-o transformare Fourier pe un tronson mai lung 
nu este identic cu cel obtinut prin medierea spectrelor pe mai multe epoci succesive mai 
scurte ce acopera acela^i tronson (cu cat componenta periodica a semnalului este mai 
ridicata, cu atat diferentele sunt mai mici). Un alt motiv al variabilitatii este insa§i natura 
semnalului, a carei evolutie in timp este reprezentata §i prin evolutia spectrului. Ar fi insa 
necesar ca spectrul, prelucrat prin metodele de mai sus, sa nu difere prea mult in acelea§i 
conditii experimentale. Acest deziderat este atins daca semnalul cules respecta anumite 
conditii. 

Cu relatiile prezente mai sus putem calcula parametrii de prelucrare ai unui 

semnal. 

Exemplu. inregistram un semnal EMG cu valori in plaja 0-10 pV, utilizand un CAN pe 8 
biti, cu frecventa de e§antionare de 500 Hz, preluand epoci de cate 2 secunde. Sa estimam: 

a) perioada de e§antionare (in ms) 

b) frecventa maxima in spectru 

c) numarul treptelor de cuantizare 

d) valoarea unei cuante de amplitudine (ce variatie de potential corespunde unui bit) 

e) rezolutia spectrala. 

Deci datele problemi sunt: Vmin = 0, Vmax = lOpV, n = 8 biti; fe = 500 Hz, AT = 2s. 
Rezolvare. 

a) Conform relatiei III. 1 : 

Te = 1 /fe = 1/500 = 0.002 s = 2 ms 

b) Din teorema de e§antionare III. 2: 

F max = F ny = fe/2 = 250 Hz 

c) Numarul treptelor de amplitudine este conform III. 3: 

N =2 n = 2 8 = 256 

d) O treapta de amplitudine (cuanta), confrm III.4 are valoarea: 

AV = (V max - V min ) / N = (10 - 0) / 256 = 0,04 (jV. 

e) Rezolutia spectrala este conform III. 6: 

Af= 1/2 = 0,5 Hz 
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Deci vom obtine un spectru pentru frecvente din 0.5 in 0.5 Hz de la 0 la 250 
Hz. 


c) Teste pentru semnalul EEG 

O caracteristica fundamental^ ceruta pentru prelucrarile semnalului este 
stationaritatea, adica mentinerea compozitiei diferitelor frecvente aproximativ constant! 
De§i s-au dezvoltat metode ce dau rezultate confidente §i in cazul semnalelor nestationare, 
problema ramane totu§i deschisa §i in privinta alegerii lungimii tronsonului; lucrand cu 
epoci scurte (T < Is), vor fi sesizate toate nestationaritatile (evenimentele tranzitorii vor 
modifica spectrul), in timp ce epocile mai lungi (sau medierea spectrelor pe tronsoane 
succesive insumand o epoca mai lunga), reduc nestationaritatile §i cresc reproductibilitatea; 
in aceste cazuri se lucreaza pe epoci de 4 - 5s, uneori §i 10s. 

O alta caracteristica este ergodicitatea; mediile temporale sunt egale cu mediile 
statistice. Validitatea acestei ipoteze ne permite sa inlocuim medierea pe mai multe realizari 
(pe ansamblu) cu medierea temporala (pe o singura realizare). 

Se mai intalne§te frecvent §i ipoteza normalitatii semnalului, conditie considerate 
uneori ca prea restrictive §i nesatisfacerea ei nu ar determina eliminarea epocii respective 
din studiu. 

Un test obligatoriu insa este testul tendinta, care verified pastrarea conditiilor de 
inregistrare; in anumite situatii este posibila o “deplasare”a liniei de zero a semnalului, ceea 
ce modifica substantial rezultatele unor prelucrari (ex. zero-crossing). Exista posibilitatea 
ca aceasta “alunecare” a liniei zero sa fie compensata prin programul de calculator. 

d) Rezultatele analizei spectrale 

Spectrele obtinute prin analiza Fourier a unui semnal divizat intr-o succesiune de 
epoci se reprezinta, in mod obi§nuit, intr-o forma comprimata (Bickford), creandu-se 
impresia unei reprezentari tridimensionale, deci in afara de axele pentru spectrul S(f) sau 
G(f) se adauga axa timp; fiecare spectru este desenat in spatele celui anterior, avand 
originea deplasata (cel mai adesea pe verticala); regiunile care “nu se vad” din cauza 
spectrului din fata nu se traseaza (metoda folosita in acest caz se nume§te “metoda liniei de 
orizont”, prin asemanarea imaginii obtinute cu imaginile unor lanturi muntoase). in fig. 
III. 17. este redata o astfel de reprezentare pentru un subiect sanatos. 



Fgiura III. 17 Reprezentarea comprimata Bickford a 8 epoci de cate 4,68 s inregistrate pe derivatia centro- 
occipitala stanga a unui subiect sanatos. [Popescu 1988] 

Modificarile in unele stari patologice sunt tipice §i evidente. in fig. III. 18 este 
redat spectrul unui pacient cu insuficienta renala cronica, inainte de dializa. Se observa 
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disparitia ritmului alfa. Dupa dializa spectrul devine normal, degenerand insa din nou 
inaintea urmatoarei §edinte de dializa. 



Figura III. 18. Reprezentarea comprimata Bickford a 8 epoci de cate 4,68 s ale unui pacient 
cu insuficienta renala cronica inainte de dializa. Puterea semnalului este mai mica in toate 
regiunile, iar ritmul alfa lipse§te. [Popescu 1988] 


Modificarile spectrelor permit §i urmarirea tratamentului efectuat in diferite tipuri 
de epilepsie (Gersch), diferite stari fiziologice (de exemplu diferite temperaturi - Pronk, tig. 
III. 19), monitorizare in timpul operatiilor pe cord, studii de psihofarmacologie (Fink), 
modificari cu varsta (Turner), etc. 



Figura III. 19. Modificari spectrale induse de modificarea temperaturii. [Popescu 1988] 


136 





D. Lungeanu, Gh.-I. Mihala§ 


1.5.5. Detectia elementelor tranzitorii 

Analiza spectrala se aseamana oarecum cu “holografia”: toate regiunile 
(punctele) semnalului initial contribuie cate putin la imaginea finala (spectru). Aceasta 
reprezinta un dezavantaj in cazul elementelor tranzitorii, de exemplu descarcari “spike” 
sau complexe “varf-unda” care, de§i au uzual amplitudini mari, sunt de scurta durata, 
deci vor contribui doar in mica masura la spectru (fig. III.20). 

O metoda simpla este folosirea analizei spectrale dar nu pe tronsoane lungi (in 
care contributia unui spike este diluata) ci pe tronsoane scurte (sub 0.5 s). Astfel contributia 
elementului tranzitoriu devine importanta §i detectia u§oara, chiar daca se pierde din 
rezolutia spectrala. Se iau succesiv mai multe astfel de tronsoane, numite in aceasta metoda 
§i “ferestre”. Aceasta metoda, propusa de Berg, se mai nume§te “metoda ferestrei mobile” 
§i adesea aceste ferestre se iau intretesute pentru a nu pierde evenimente care ar putea fi 
eventual fragmentate in doua ferestre succesive (fig. III.20) 



Figura III.20 . Metoda ferestrei mobile pentru detectia elementelor tranzitorii (Berg). 

[Popescu 1988] 


O abordare cu totul diferita este deci necesara pentru detectarea spike - urilor §i 
undelor ascutite (miu), elemente care sunt de mare importanta la citirea unei 
electroencefalograme. Pentru detectia spike - urilor de catre calculator (Kooi, 1996) s-au 
definit o serie de parametri, care sunt comparati cu standarde: panta ramurii ascendente, 
panta ramurii descendente, unghiul de varf, amplitudinea, durata etc. (fig. III.21.a). 
Deoarece evenimentele din spike - uri sunt foarte rapide, filtrarea semnalului utilizata inainte 
de inregistrare diminueaza frecventele inalte (de obicei nu le elimina de tot), impiedicand o 
evaluare exacta a fenomenelor rapide; chiar frecventa de e§antionare utilizata pentru 
analizele temporale sau/§i frecventiale ar putea fi prea mica pentru o analiza detaliata a 
spike- urilor. Teoretic, parametrii pot fi definiti satisfacator, dar calculul lor este laborios, 
fiind necesare extrapolari pentru evaluare. 
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Fiura. III.21. Detectia spike- urilor. a) Caracteristicile uni spike; panta nu se calculeaza cu 
punctele din varf, care datorita e§antionarii diminueaza putemic panta; b) aspectul 
derivatelor I §i II in cazul spike- urilor, comparativ cu variatiile mai lente. [Popescu 1988] 


O alta tehnica de detectare a spike-\xn\or este calculul derivatelor de ordin I §i II 
ale semnalului (fig. 111.21. b), ceea ce a dus §i la realizarea unor dispozitive analogice, 
simple §i fidele, dedicate unor tipuri de unde. Totu§i, tehnicile numerice au o raspandire 
mai larga decat cele analogice. 


1.5.6. Metode parametrice 

Un element esential cautat de aproape toate metoele de prelucrare este 
reducerea, adica sintetizarea informatiei continute de semnal intr-un numar cat mai unic 
de parametrii. Metodele enumerate mai sus prezinta toate un oarecare grad de reducere 
(comprimare), insa sunt adesea insotite inca de reprezentari grafice, iar numarul 
parametrilor caracteristici este inca ridica. Pare deci fireasca tendinta de cautare §i 
pentru semnalul EEG a unui numar redus de parametri care sa contina “toata” 
informatia despre semnal. Au fost numeroase propuneri, unele metode au fost chiar 
primite cu entuziasm insa in cele din urma s-au dovedit toate insuficiente pentru a 
comprima intr-o maniera atat de simpla un semnal atat de comlex. Abia metodele 
integrative, ce vor fi expuse dupa acest paragraf, izbutesc sa comprime satisfacator 
semnalul real. Ele folosesc §i parametrii propu§i in metodele numite “parametrice”. Sa 
ne oprim la cele mai importante metode. 

a) Metoda parametrilor statistici. S-au propus indicatorii statistici uzuali 
(medie, deviatie standard, momente, asimetrie, exces), de§i corelatia lor cu 
diferite stari fiziologice sau patologice nu a fost prea puternica. 

b) Metoda descriptorilor normalizati (Hjorth) a atras de la inceput, prin 

reducerea descrierii semnalului la trei parametri numiti activitate, mobilitate §i 

complexitate. 

Activitatea 

A = t Ja (ffl.7..a) 

2 

unde <7 a este variatia amplitudinilor. 
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Mobilitatea 

M = a a / <r a (III.7.b) 

a d fiind deviatia standard a pantelor, iar a a a amplitudinilor; cum curba pantelor este de fapt 
prima derivata a semnalului, mobilitatea poate fi considerate o frecventa medie. 


Complexitatea 


C = 


J a dd /cr d-°'d /cr a 


(III.7.C) 


cr dd fiind deviatia standard a vitezei de variatie a pantei, deci este legate de 
derivata a doua a semnalului. 


Construirea unor electroencefalografe care realizeaza automat §i analiza Hjorth pe 
fiecare din cele 16 canale (de ex. Mingograf Siemens) a determinat o raspandire mai large a 
metodei. O prezentare comparative a metodei descriptorilor Hjorth cu alte metode a fost 
fecute de Irwin. 

in dezvoltarea acestei metode, o importante contribute a fost aduse de §coala 
romaneasce de neurologie reprezentate prin lucrarile lui C. Arseni §i L. Popoviciu. S-au 
elaborat, astfel, “herti computerizate” ale creierului pentru numeroase cazuri normale, in 
diferite steri fiziologice (somn) §i patologice (epilepsii, tumori), obtinandu-se o semiologie 
recunoscute pe plan mondial. Sunt deosebit de interesante evolutiile in timp ale liniilor 
izopotentiale, fiind astfel pentru prima date descrise fazele intime ale declan§erii actiunii 
focarelor epileptice. Compararea hertilor computerizate cu imaginile obtinute prin 
tomografie au adus noi date privind cunoa§terea fenomenelor cerebrate. 

Actualmente se incearce dezvoltarea modelelor prin completarea parametrilor §i 
includerea aspectelor generate in metoda recunoa§terii pattern- ului. 

c) Filtrarea autoregresiva Kalman (Fenwick). Asemenarea semnalului EEG cu 
un semnal aleator cu distribute normale §i medie zero (“zgomot alb”) a sugerat 
posibilitatea descrierii sale prin parametrii unei retele de filtre liniare, fere a presupune 
vreo relatie a modelului cu activitatea de generare a semnalului EEG. 


1.5.7. Metode integrative de analiza. Metoda “pattern recognition” 

Metoda pattern recognition, traduse uneori nepotrivit §i ca “recunoa§tere a 
formelor”, constituie o abordare mai large, in cadrul cereia unii parametri estimati prin 
metodele anterioare se devim atribute ale pattern- ului. Aplicabilitatea metodei nu se 
limiteaze la prelucrarea EEG, ci este cu totul generate. 

a) Principiile recunoa^terii pattern-ului 

Capacitatea de a recunoa§te ceva este o caracteristice generate a fiintelor umane, 
chiar §i a altor fiinte. Procesul de recunoa§tere il practicem in permanente: recunoa§tem 
obiecte, melodii, tablouri, un scris de mane, pa§ii unui cunoscut pe scare, chiar unele steri 
suflete§ti. Cum? Printr-o deosebite capacitate de prelucrare a unor informatii, adice un 
sistem complex de recunoa§tere a unor atribute ale obiectului. in prima faze a procesului de 
recunoa§tere, selectem cele mai caracteristice atribute, obtinand un rezumat tipic at 
informatiilor, numit pattern, in faza urmetoare, asociem acestui pattern un nume, 
comparand pattern - ul sesizat cu un set intreg de pattern - uri din memorie §i selectandu-1 pe 
cel mai apropiat. 
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Exista doua abordari principale de recunoa§tere a pattern- ului: metoda clasificarii , 
cand clasele de pattern-mi sunt cunoscute dinainte §i metoda gruparii (clustering 
approach), cand scopul este crearea §i defmirea claselor. 

Un sistem de recunoa§tere a formelor cuprinde trei tipuri de prelucrari de date: 

- achizitia datelor; 

- extragerea atributelor (feature extraction ); 

- clasificarea. 

Primele doua tipuri de prelucrari se efectueaza utilizand cuno§tinte anterioare 
despre obiectele de clasificat. O cerinta esentiala pentru a obtine rezultate bune este ca setul 
initial de date sa fie reprezentativ. Aceste date initiate se impart in doua categorii: setul de 
“invatare” §i setul de “testare”. Pe baza setului de invatare se determina o regula de 
decizie, pentru a distinge pettem- uri din diferite clase. Calitatea clasificarii pe care o poate 
realiza sistemul se estimeaza prin testarea cu datele din al doilea set. 

Unii autori considera ca o recunoa§tere propriu-zisa o intalnim doar in metoda 
clasificarii, in timp ce metoda gruparii pare potrivita ca o etapa anterioara pentru defmirea 
unor clase, cand astfel de defmitii nu exista sau nu sunt suficient de precise. 

b) Construirea unui pattern. Extragerea atributelor 

Este desigur esentiala faza de extragere a atributelor (marimile cu capacitate de 
desciminare) pentru a defini un pattern, care poate fi realizata pe doua cai: 

i° Arbordarea vectoriala: toate caracteristicile masurate formeaza un vector in 
spatiul masuratorilor: ; extragerea atributelor ar insemna trecerea intr-un spatiu cu mai 
putine dimensiuni - spatiul atributelor (sau spatiul pattern- urilor), care se realizeaza prin 
defmirea unui criteriu calitativ ce caracterizeaza distributia pattern- urilor, definirea unui set 
de functii pentru mapping §i selectarea functiei optime. 

Definirea criteriului calitativ se face prin diverse metode asupra carora nu ne 
oprim aici. 

ii° Abordarea structural a, in care se considera ca rezultatul unei masuratori este o 
inlantuire de elemente §i se cauta elementele de baza prin care atat numarul acestora, cat §i 
pierderea de informatii sa fie minime. 

c) Sinteza clasificatorului 

Fiind dat un set de invatare se cauta functii de decizie ce corespund celor K clase. 
Calitatea clasificatorului se masoara prin rata erorilor de clasificare §i de generalizare. 

Exista mai multe cai pentru stabilirea regulilor de decizie, cei mai uzuali 
clasificatori fiind cei de distanta, bazati pe reguli geometrice intr-un spatiu n - dimensional. 

Abordarile teoretice in metoda pattern recognition sunt destul de sofisticate, iar 
aplicatiile de acest tip necesita resurse importante, fiind implementate mai mult pe 
calculatoare putemice. 

d) Aplicarea recunoa^terii pattern-ului la semnalul EEG 

Faptul ca aceasta metoda ia in considerare mai multe aspecte a determinat 
numero§i cercetatori sa imbine aspectele temporale cu cele frecventiale, la care sa adauge 
§i alte atribute (fig. III.22), §i sa obtina astfel - o descriere mult mai fidela a semnalului 
EEG. Vom reda doar cateva aspecte mai importante. 

i° Atribute folosite: s-au testat numeroase caracteristici, dintre care enumeram o 

parte: 

- atribute spectrale: putere absoluta sau relativa a unui ritm (5, A, a, (3) frecventele 
medii ale ritmurilor respective etc; 
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- atribute interval / amplitudine: numar de traversari axa in diferite intervale de 
timp, in semnal §i in prima derivata, suma amplitudinilor semiundelor etc.; 

- descriptorii normalizati Hjorth §i coeficientii filtrului Kalman. 

ii° Atribute selectate : dupa ce au fost incercate pe grupe de atribute, lista s-a redus 
la: frecventa medie, puterea procentuala a undelor delta, numeral total de traversari ale axei 
pentru semnal §i pentru prima derivata, primii trei coeficienti Kalman, radacina patrata a 
activitatii, mobilitatea §i complexitatea. 

iii° Clasificarea, efectuata in scopul urmaririi asimetriei semnalului, a utilizat in 
prealabil o ierarhizare a atributelor selectate, criteriul cel mai putemic fiind radacina patrata 
a activitatii Hjorth. 

iv° Evaluarea clasificarii s-a efectuat cu setul test, luand in considerare separat 
erorile de clasificare fals pozitive §i fals negative, eroarea medie de clasificare fiind de circa 
25 %. 


2.400 


NLM2 


-2.800 

-3.300 NLM1 2.700 

Figura III. 22. Reprezentarea intr-un spatiu cu 6 dimensiuni a semnalelor EEG culese de la 
un pacient dializat. Gruparile de puncte apartin diferitelor perioade (inainte, in timpul §i 
dupa dializa). Prelucrare prin pachetul ISPAHAN. [Popescu 1988] 

e) Avantaje §i limite ale metodei recunoa§terii pattern-ului 

Aceasta metoda, inca in curs de dezvoltare, este considerate de mare perspective, 
in special datorite faptului ce tine cont de numero§i factori pe care ii selecteaze in functie de 
calitatea clasificerii obtinute pe lotul de invetare. in acest scop s-au §i creat pachete de 
programe specializate pentru problema recunoa§terii pattern - urilor (ex: ISPAHAN). 

Existe insd §i unele comentarii care limiteaze entuziasmul ardtat metodei. in 
primul rand, este necesar un numdr imens de date pentru “lotul de invetare” §i pentru “lotul 
de test”. De§i nu existe un criteriu concret, se apreciaze ce numerul de cazuri trebuie se fie 
de cel putin cinci ori mai mare decat numerul de atribute considerate inmultit cu numerul 
de clase. Aici ajungem in fata unui compromis - scdderea numerului de atribute. Dar 
scederea numerului de atribute considerate, ar putea influenta calitatea clasificerii (totu§i s- 
a aretat ce “indicele de merit” este concentrat doar de cateva atribute), in timp ce cre§terea 
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ar mari numarul de date care nu numai ca ar lungi §i timpul de rulare ci, destul de des, nu 
avem suficiente date pentru loturile initiate. 

Un alt dezavantaj it constituie capacitatea de clasificare inca insuficient de ridicata 
(s-au realizat totu§i comparatii cu clasificarile realizate de grupuri de medici; variatiile de 
clasificare, care in cazul calculatorului se numesc “erori de clasificare”, au fost de acela§i 
ordin de marime). 

De§i exista aceste limitari, metoda recunoa§terii pattern - urilor este totu§i mai 
complexa decat celelalte metode (incluzandu-le de fapt, daca le preia atributele). 

1.5.8. Analiza sintatica 

O caracteristica esentiala a semnalelor EEG este dinamica lor, in termeni tehnici 
fiind “nestationaritatea”. Sa ne reamintim ca, din punct de vedere teoretic, aplicarea 
analizei frecventiale solicita implinirea conditiei de stationaritate a semnalului. Pentru 
tronsoane scurte (sub 2s) aceasta conditie nu este indeplinita insa ea devine satisfacatoare 
de la 4-5 s in sus. Totu§i, ne putem lesne imagina ca numeroase fenomene cerebrate pot fi 
foarte rapide §i conditia de stationaritate nu ar face decat sa ilustreze doar o “activitate 
medie” a creierului care ar putea intr-adevar fi considerate aproximativ constants pentru o 
anumita stare a subiectului. Analiza activitatilor cerebrate intime trebuie totu§i sa acorde 
atentia cuvenita evenimentelor scurte sau rapide astfel incat, cu riscul sacrificarii rezolutiei 
spectrale, cercetarile au investigat in detaliu §i evolutiile pe epoci scurte. Un grup de 
cercetare al Universitatii Vanderbilt din Tennessee a propus o metoda sintatica de analiza a 
semnalelor EEG, care ar cuprinde urmatoarele faze: 

divizarea semnalului cules (pe mai multe canale) in epoci scurte (0.3-1 s) 
efectuarea tuturor analizelor elementare pe aceste epoci 
aplicarea metodei “pattern recognition” pentru fiecare epoca; se pot astfel 
defini o serie de “tipuri de activitati” care vor fi caracterizate fiecare printr-o 
eticheta (“label”) a epocii 

succesiunea epocilor va fi reprezentata printr-o succesiune a etichetelor, care 
formeaza o “propozitie” 

se analizeaza “propozitiile” obtinute in diferite tipuri de activitati 

se aplica analiza sintactica a acestor propozitii pentru clasificarea activitatilor 

cerebrale. 

Prin aceasta metoda au putut fi clasificate cateva tipuri de activitati cerebrale 
iar cercetarile sunt in plin avant, a§teptandu-se ca prin imbinarea acestor metode 
sintactice cu cele de ’’pattern recognition” sa se obtina identificarea unor tipuri de stari 
sau activitati ale creierului uman. 

1.5.9. Potentiale evocate 

Studiul activitatii cerebrale de fond, de§i aduce o serie de date privind starea 
fiziologica sau patologica a subiectului, nu reprezinta decat o imagine partiala a 
functionalitatii creierului. De§i se iau toate precautiile pentru a nu modifica conditiile de 
inregistrare, caracterul nestationar al semnalului apare destul de des in evidenta. O serie de 
date noi apar insa atunci cand urmarim ecoul la nivel cerebral al unor stimuli controlati de 
noi. Potentialele inregistrate in aceste conditii reflecta evident modul de reactie a creierului 
la modificarea conditiilor, contribuind la aprofundarea mecanismelor care sunt atat de putin 
cunoscute. Se explica astfel §i interesul deosebit acordat studiilor de acest gen, care devin 
din ce in ce mai numeroase. 

Natura stimularii poate fi diversa. Cele mai numeroase studii se refera la 
stimularea vizuala (cu lumina stroboscopica sau, mult mai des, cu modele tip tabla de §ah), 
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stimularea auditiva (sunete de diferite durate sau inaltimi, uneori modulate cu frecvente mai 
joase) sau stimularea somatica. 

a) Extragerea semnalului 

Problema majora in studiul potentialelor evocate o constituie amplitudinea mica a 
raspunsului (cativa pV), care fiind suprapus peste activitatea de fond, de 50 - 100 pV, 
in mod obi§nuit nici nu se observa pe traseu. Considerand ca semnal potentialul evocat iar 
activitatea de fond ca zgomot, extragerea semnalului devine o problema de cre§tere a 
raportului semnal / zgomot. Presupunand ca potentialul evocat apare intotdeauna cu aceea§i 

latenta dupa stimulare, Dawson a introdus metoda superpozitiei, prin care se suprapun 
epoci de semnal, fiecare epoca incepand in momentul stimularii. Deoarece activitatea de 
fond este aleatoare, regiunile fara raspuns evocat i§i compenseaza valorile, in timp ce 
regiunile ce contin raspunsul i§i amplified valorile (fig. III.23), aparand in felul acesta 
metoda medierii, care s-a raspandit foarte rapid dupa aparitia mediatoarelor electronice. 

O alta metoda de extragere a semnalului din zgomot este analiza Fourier intr-o 
banda ingusta de frecventa, in cazul in care stimulul se repeta la intervale regulate. 

in studiile privind potentialele evocate se recomanda utilizarea unei frecvente de 
e§antionare ridicate, deoarece fenomenele sunt rapide (sunt necesare rezolutii de ordinul 
milisecundei); de asemenea, fiind necesare precizii ridicate de evaluare a amplitudinilor, se 
recomanda convertoare de 12 - 16 biti. 

b) Nestationaritatea potentialelor evocate 

Metoda medierii sau analiza Fourier ar aduce semnalul la forma sa pura daca ar fi 
adevarata ipoteza ca potentialul evocat ar fi identic la fiecare stimulare. Constatarile 
experimentale arata ca potentialele evocate se modifica progresiv in timp, ceea ce limiteaza 
acuratetea cu care pot fi comparate doua potentiate evocate. 

S-au incercat mai multe variante de a reduce erorile datorate nestationaritatii, fie 
prin stimularea simultana a diferitelor regiuni, fie, in cazul stimularii vizuale, prin 
modularea intensitatii stimulului cu un zgomot cu repartitie normala. 

Trebuie mentionat §i fenomenul de obi§nuinta la ritmul stimularii: in anumite 
cazuri, dupa un set de stimuli repetati la intervale regulate, daca se opre§te stimularea se 
mai obtin inca raspunsuri. 



Figura III.23. Extragerea potentialului evocat prin mediere. a) evolutia stimulului luminos; 
b) inregistrarea unei stimulari; c) medierea a 2 stimulari; d) medierea a 5 stimulari; e) 
medierea a 100 de stimulari; f) semnalul din (e) amplificat. [Popescu 1988] 
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Pentru a inlatura efectele fenomenului de obi§nuinta, stimulatorul trebuie sa genereze 
stimuli la intervale neregulate de timp, iar sumatorul sau mediatorul sa fie de asemenea 
comandat de stimulator. S-au realizat dispozitive dedicate pentru aceste stimulari §i 
medieri, numite “averager”. 

c) Analiza potentialelor evocate 

Considerand un potential evocat inregistrat cu toate precautile tehnice, putem 
extrage din el o serie de parametri deosebit de importanti: latenta, undele caracteristice 
(pozitive sau negative), durata lor etc. Din punct de vedere teoretic, problemele ridicate 
sunt similare cu cele de la analiza temporala a semnalelor (analiza intervalelor sau interval / 
amplitudine): definirea liniei de zero, definirea undelor etc. O serie de metode caracteristice 
prelucrarii semnalelor de fond se aplica §i in studiul potentialelor evocate: analiza 
corelatiei, analiza Fourier, pattern recognition. 

d) Clase de potentiale evocate 

S-au stabilit mai multe categorii separate de potentiale evocate. in categorisirea 
unui potential evocat, se intampla destul de des ca acesta sa apartina mai multor categorii. 
O prima clasificare imparte potentialele legate de procesul de stimulare §i potentiale legate 
de procesul de cunoa§tere - apar a§a-numitele “unde de a§teptare”; tot in aceasta clasa intra 
§i undele P300 (denumirea provine de la faptul ca deflexia este pozitiva §i au o durata de 
circa 300 ms). 

O alta clasificare cuprinde categoriile: potentiale evocate tranzitorii §i potentiale 
evocate stationare. Potentialele tranzitorii, numite uneori §i singulare, se obtin printr-o 
stimulare unica. Analiza acestor semnale este mai laborioasa §i se efectueaza in special in 
domeniul temporal. Mecanismele generarii diferitelor unde §i semnificatia lor nu sunt inca 
elucidate. Potentialele stationare se obtin prin stimularea repetata §i se analizeaza prin 
metoda medierii descrisa mai sus (fig. III.24). 



Figura 111.24. Raspuns vizual evocat: (1) la un subiect normal; (2) la un subiect cu scleroza 
inplaci. [Popescu 1988] 

Cele doua metode au avantajele §i dezavantajele lor. Pentru studiul variabilelor 
cognitive, potentialele evocate tranzitorii par cu mult mai bune decat cele stationare. in 
acela§i timp, potentialele evocate stationare pot fi prelucrate imediat de un analizator 
Fourier §i reprezentate ca “medie mobila” (care se deplaseaza in timp). De asemenea, in 
studiul potentialelor evocate este important, deseori, ca §edinta de inregistrare sa fie cat mai 
scurta, metoda analizei Fourier fund din acest punct de vedere mai potrivita decat altele. 

Din cele prezente mai sus rezulta, evident, efortul mare depus pentru analiza 
semnalelor EEG. De§i exista §i o serie de aplicatii clinice (diagnosticul unor epilepsii, 
detectarea unor tumori, monitorizarea in timpul operatiilor etc.), majoritatea metodelor sunt 
dedicate cercetarilor fundamentale, care tintesc intelegerea mai profunda a proceselor 
cerebrale - ce §i cum se modifica in diferite stari fiziologice §i/sau patologice. 
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2. INTRODUCERE IN PRELUCRAREA IMAGINILOR 
DIGITALE 

2.1. DE CE PRELUCRAREA IMAGINILOR? 

Preocuparea pentru dezvoltarea unor metode de prelucrare a imaginilor vine 
din doua arii de preocupari: 

(a) imbunatatirea imaginilor pentru a fi mai u§or interpretabile de catre om; 

(b) procesarea datelor din imagini pentru perceptia automata (" machine 

perception ") - recunoa§terea automata sau autonoma. 

Tehnicile de prelucrare de imagini i§i au originea la inceputul anilor 1920, 
cand a fost instalat cablul submarin intre Londra §i New York §i primele imagini au 
putut fi transmise pe aceasta cale. Timpul necesar transmiterii unei fotografii s-a redus 
de la ceva mai mult de o saptamana (cu vaporul) la mai putin de trei ore. Echipamentele 
specializate (cantarind mai mult de 15 tone) codau imaginile inainte de transmisie §i le 
de-codau la receptie, imprimandu-le. Primele sisteme Bartlane de codificare au avut o 
“finete” de cinci nivele distincte de luminozitate (in 1921), evoluand foarte repede in 
urmatorii ani, astfel ca in 1929 se ajunsese la 15 nivele. 

in timpul urmatorilor ani metodele de procesare §i transmisie s-au dezvoltat 
continuu, impulsionate fiind de dezvoltarea retelelor de televiziune. Cu toate acestea, 
abia in 1964 s-a utilizat tehnica de calcul la prelucrarea imaginilor: imaginile selenare 
transmise de Ranger 7 aveau distorsiuni §i zgomote cu caracter regulat §i au putut fi 
considerabil imbunatatite utilizand programe de calculator. De la acest punct de pornire, 
tehnicile de imbunatatire §i restaurare a imaginilor transmise de misiunile spatiale a 
devenit un lucru obi§nuit: misiunile Surveyor pe Luna, seriile Mariner pe Marte, 
misiunile Apollo cu echipaj uman, etc. 

Tehnicile dezvoltate au fost apoi utilizate §i in alte domenii, adaptandu-se sau 
dezvoltandu-se metode noi, specifice imaginilor prelucrate §i scopului in care ele sunt 
utilizate. 

O sfera importanta de preocupari o constituie aplicatiile ce au ca scop 
imbunatatirea calitatii imaginilor pentru a scoate in evidenta continutul util. Ele au ca tel 
final interpretarea §i analiza facuta de catre speciali§tii umani. Astfel de aplicatii au 
fost dezvoltate in medicina, geografie, meteorologie, fizica, astronomie, aparare, diverse 
domenii industriale. Medicina a fost intotdeauna un lider in dezvoltarea de aplicatii 
datorita importantei extraordinare a imagisticii in investigatiile medicale. 

O alta arie majora de preocupari este recunoa§terea automata a imaginilor 
(“ machine perception ”). in acest caz efortul este concentrat pe dezvoltarea de proceduri 
pentru “extragerea” informatiei imagistice intr-o forma potrivita pentru prelucrarea 
automata §i formalizata. Printre problemele tipice care au fost in parte rezolvate §i exista 
aplicatii ce au depart deja faza de laborator (fiind utilizate in mod curent): recuno§terea 
automata a caracterelor ( Optical Character Readers - OCR), sisteme de vedere 
artificial^ in domeniul industrial (linii de asamblare, controlul calitatii), prelucrarea 
amprentelor digitale, predictii meteorologice, aparatura de analiza automata a probelor 
sanguine. 

Aceste sisteme de recunoa§tere automata ajung la performance extraordinare 
(viteza §i acuratete ridicate) in aria ingusta de probleme pentru care ele sunt create. 
Trebuie insa accentuat ca sistemul vizual uman este neegalat in performanta prin 
varietatea mare de imagini pe care le poate prelucra §i “intelege”, ca §i prin capacitatea 
de adaptare la conditii noi de perceptie in functie de context §i de experientele 
anterioare. Acesta este unul din motivele pentru care studierea mecanismelor vizuale 
umane ramane un domeniu important de preocupari nu numai pentru cercetatorii din 
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domeniul bio-medical, ci §i pentru cei din domeniile tehnice. Un fapt important de 
subliniat este ca cercetarea actuala recurge, de regula, la abordari interdisciplinare. 

2.2. Fundamente. Un model de imagine 

Termenul de imagine monocroma sau simplu imagine se refera la o functie a 
intensitatii luminoase, notata f(x,y). Ea reprezinta intensitatea (luminozitatea) imaginii 
in sensul comun al cuvantului in punctul de coordonate (x,y). Cum lumina este o forma 
de energie, ea trebuie sa fie strict pozitiva §i finita: 

0<f(x,y)<co 

Imaginile pe care le percepem in viata de zi cu zi constau din lumina reflectata de 
obiectele din jur. De aceea, natura functiei f(x,y) poate fi caracterizata de doua 
componente: 

( 1 ) iluminare i(x, y ) 

(2) reflectanta r(x, y) 

f(x,y) = i(x,y)-r(x,y) 

Iluminarea reprezinta cantitatea de lumina incidents in punctul respectiv §i este o 
caracteristica a sursei de lumina: 

0 <i(x,y) <oo 

Reflectanta caracterizeaza proprietatile obiectului - cantitatea de lumina reflectata: 
0<r(x,y) <1 

Reflectanta este scazuta pentru obiectele pe care le percepem ca fiind negre sau inchise 
la culoare §i are valori tot mai ridicate pentru obiectele de culoare deschisa/stralucitoare. 

Pe parcursul acestei introduceri in prelucrarea imaginilor digitale, vom nota 
intensitatea imaginii monocrome in punctul de coordonate (x,y) cu / §i vom numi 
aceasta valoare nivel de gri al imaginii in punctul respectiv: 

Lmin — l — Lmax Lmin hnin * ^min $i ^ max hnax^max 

[ L min , L max \ va constitui scara de gri a imaginii respective. 

in practica, se obi§nuie§te sa se lucreze cu o scara de gri normalizata: [0 , L]. 

Conventia este: 

1=0 este considerata a fi negru 
/= L este considerata a fi alb 

Valorile intermediare vor fi nuante de gri. Cu cat L are o valoare mai mare, cu atat 
finetea de prelucrare este mai ridicata. Valoarea L depinde de aplicatia respective, de 
precizia cu care se lucreaza, etc. Sistemul vizual uman distinge aproximativ 64 de 
nuante, dar sistemele artificiale lucreaza, de regula, cu un numar mai mare de nivele de 
gri. 


Principiile de obtinere a imaginilor nu se limiteaza insa la spectrul vizibil al 
undelor electromagnetice. Pentru imaginile obtinute cu aparatele Rontgen, nivelul de gri 
/ este o masura a reflexiei sau absorbtiei radiatiei X, in timp ce in ecografie se utilizeaza 
ultrasunetele. in acest fel, se poate vizualiza/investiga interiorul corpului uman fara a-i 

cauza neajunsuri majore (utilizand proceduri cat mai putin invazive). Primul pas in 
procesarea imaginilor este achizitia acestora §i vom prezenta pe scurt principalele 
metode utilizate in imagistica medicala, deoarece imaginile obtinute folosind lumina 
vizibila constituie o parte infima din imaginile medicale. 
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Deoarece in acest curs prelucrarea imaginilor este abordata dupa celelalte 
prelucrari de date (inclusiv semnale), consideram oportun sa prezentam o sinteza a 
metodelor de procesare a datelor. Tabelul urmator considera datele in sens general, 
sistematizand metodele functie de tipul de informatie de la intrare (input), respectiv 
rezultatul obtinut in urma aplicarii metodei (output): 


output 

input 

date 3-D 
imagine 3-D 

date 2-D 
fotografie 

date 1-D 

semnal 

vector 

caracteristici 

date 0-D 

identitate 

date 3-D 
imagine 3-D 

restaurare 

imbunatatire 

detectia 
limitelor ob. 

detectia 

liniilor 

analiza 

imaginilor 

interpretarea 

imaginilor 

date 2-D 
fotografie 

reconstructs 

restaurare 

imbunatatire 

detectia 
limitelor ob. 

analiza 

imaginilor 

interpretarea 

imaginilor 

date 1-D 
semnal 

reconstructs 

reconstructs 

prelucrarea 

semnalelor 

analiza 

semnalelor 

interpretarea 

semnalelor 

vector 

caracteristici 

grafica 3-D 
(or. obiecte) 

grafica 2-D 
(or. obiecte) 

afi§are vector 

procesarea 

datelor 

pattern 

recognition 

date 0-D 

identitate 

modelare 

modelare 

(pict.2-D) 

model/schita 

(pict.l-D) 

exemple 



Adaptata dupa [Van Bemmel&Musen 1997] 


Subliniem faptul ca aceasta clasificare nu este totdeauna stricta §i ca anumite proceduri 
pot fi un scop in sine, in timp ce altele sunt doar pa§i intermediari pentru prelucrari mai 
complexe. Problemele legate de grafica §i de modelare nu vor fi abordate in aceasta 
prezentare (iar cele de imagistica 3-D doar tangential), dar consideram sinteza utila 
pentru a va putea sistematiza notiunile de prelucrare a semnalelor privite la modul 
general. 

2.3. Notiuni elementare de imagistica medicala 

Intr-o masura foarte mare, imagistica medicala este practic imposibila fara 
tehnica de calcul - ea se bazeaza pe principii fizice care necesita un volum considerabil 
de calcule pentru a reda sub forma vizuala informatia culeasa. Calculatoarele se 
utilizeaza in imagistica medicala pentru: 

■ construirea imaginilor din masuratori ale unor parametri fizici 

■ re-construirea unor imagini pentru o “extragere” optima a caracteristicilor 

■ prezentarea imaginilor pentru a putea fi analizate in timpul actului medical 

■ imbunatatirea calitatii imaginilor 

■ masuratori efectuate pe imagini - caracteristici geometrice, de 
coloare/intensitate, de textura, etc. 

■ segmentarea imaginilor - descompunerea lor in diverse componente 

■ arhivarea imaginilor (stocarea §i regasirea lor) - de cele mai multe ori implica 
utilizarea unor tehnici de compresie. 

Multe din imaginile medicale sunt generate utilizand radiatie cu lungime de 
unda diversa (de regula nu in spectrul vizibil) §i sunt apoi prezentate utilizand un suport 
auxiliar (monitor sau film fotografic). Exista insa §i imagini obtinute in spectrul vizibil, 
ca cele obtinute prin endoscopie sau cele din chirurgia estetica. 

Prezentam, pe scurt, principalele metode de obtinere a imaginilor medicale. 
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Imagini Radiologice 

Potentialul radiatiei X de a fi utilizata pentru investigarea nedistructiva a 
interiorului corpului uman a fost sesizat imediat dupa descoperirea acesteia de catre 
Julius Roentgen in 1895. Metodele au fost perfectionate continuu pentru a deveni tot 
mai putin nocive §i mai precise. Lungimile de unda utilizate in domeniul medical sunt 
cuprinse in intervalul 0.1 — 1°A. 




Figura III.2.3.2. intarirea contrastului unei imagini radiografice 

Radiologia clasica a utilizat filmul fotografic §i ne punem intrebarea fireasca 
daca este utila prelucrarea imaginilor radiografice 2-D cu ajutorul calculatorului? 
Credem ca raspunsul este evident pozitiv: pe langa facilitatea de stocare/regasire a 
imaginilor, tehnica de calcul ofera posibilitatea unor prelucrari simple §i rapide atunci 
cand este nevoie (figurile III.2.3.1 §i III.2.3.2 sunt doar ni§te exemple). 

O tehnica radiologica ce nu poate fi insa aplicata fara ajutorul tehnicii de calcul 
este angiografia digitala - DSA (Digital Substracted Angiography). Tehnica se 
utilizeaza in situatii cand este nevoie sa se vizualizeze vase sau cavitati interne ce sunt 
ecranate de prezenta unor tesuturi cu densitate ridicata (de regula oase). Un exemplu 
este cel prezentat in figura III.2.3.3, in care a fost necesara investigarea retelei de vase 
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din zona craniana. S-a injectat o substanta opaca la radiatia X §i s-a efectuat o 
radiografie. Pentru zonele abdominale metoda aplicata in acest fel conduce la rezultate 
multumitoare, dar in acest caz imaginea obtinuta (a) are un contrast scazut §i, practic, in 
ea nu se poate distinge nimic util din punct de vedere medical. De aceea, se 
achizitioneaza cel putin doua imagini: una inainte de injectarea substantei de contrast §i 
una dupa. Prima imagine poarta numele de “masca” §i ea se “extrage” prin tehnici 
digitate din imaginea a doua, scotandu-se astfel in evidenta tocmai diferenta dintre cele 
doua imagini - reteaua de vase (b). 



Figura III.2.3.3. in Digital Sub stracted Angiography se utilizeaza substanta de contrast 
opaca la radiatia X, preluandu-se doua imagini (inainte §i dupa injectarea substantei de 

contrast). Informatia utila (imaginea b in figura) se obtine “scazand”-o pe prima (masca) din 
imaginea preluata dupa injectarea substantei de contrast 

Tehnica de calcul ne ajuta nu numai sa facem calculele necesare operatiei de 
“scadere” a celor doua imagini, ci §i potrivirea imaginilor prin tehnici de corelatie 
(asemanatoare celor descrise la prelucrarile de semnale) deoarece este practic imposibil 
ca pacientul sa fie pozitionat identic pentru cele doua imagini. Operatia poarta numele 
de 66 image registration ” §i este necesara ori de cate ori se fac operatii de comparare, 
scadere, etc. a doua sau mai multe imagini (ele trebuiesc translatate, rotite, scalate sau 
“intinse” pentru a se potrivi). 

In mod normal, se achizitioneaza mai multe imagini post-contrast pe masura ce 
substanta de contrast difuzeaza iar contrastul devine mai puternic in zonele periferice §i 
scade in regiunea proximala punctului de injectie. Ele se vor combina pentru a obtine 
imagini de calitate in conditiile utilizarii unor cantitati mici de substanta de contrast §i a 
unei iradieri de cat mai mica intensitate. 

Tomografia Computerizata 

Un neajuns major al imaginilor radiologice este faptul ca ele redau in doua 
dimensiuni o realitate tridimensionala - “pierderea” unei dimensiuni conduce implicit la 
pierdere de informatie, lucru pe care medicii il compenseaza prin cuno§tintele specifice, 
prin intuitie, etc. Chiar atunci cand aceste imagini sunt “imbunatatite” (ca in situatia 
angiografiei digitale), ele raman o proiectie bidimensionala a realitatii. Mai mult, prin 
tehnicile clasice este imposibil sa se faca distinctie intre tesuturile moi pentru ca 
diferenta neta este intre os §i aer, sau intre substanta de contrast §i tesuturile moi luate 
impreuna. 

Inventia tomografiei computerizate cu raze X (Godfrey N. Hounsfield, 1971), 
rasplatita cu un premiu Nobel in 1979, a produs o adevarata revolutie in lumea 
medicala. Aceasta tehnica (ilustrata in figura III. 2. 3. 4) permite vizualizarea unor 
sectiuni bi-dimensionale “taiate” in zonele de interes din corpul investigat. 
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Figura III.2.3.4. Principiul proiectiei inverse utilizat in tomografia computerizata. 
Presupunem ca sectiunea pe care dorim s-o vizualizam are forma eliptica (a) cu doua 
formatiuni de densitate diferita in interior (de exemplu o sectiune prin antebrat). Se fac doua 
“radiografii” (pe directii perpendiculare) cu fascicole foarte inguste de radiatie X §i se obtin 
profile de absorbtie bidimensionale (b). Combinandu-se cele doua surse de informatie, se 
redau diferentele de densitate in sectiunea bi-dimensionala investigate (c) 



Figura III.2.3.5: Principiul tomografiei computerizate utilizat in investigatiile medicale - 
preluat din [Van Bemmel&Musen 1997] 


in practica, imaginile sunt reconstruite pornind de la un numar mare de ’’profile 
de absorbtie”, luate la intervale unghiulare constante pentru o incidents data - figura 
III. 2. 3. 5. Utilizand sute de astfel de profile pentru o sectiune data, calitatea obtinuta este 
ridicata (ce a fost ilustrat in figura III.2.3.4 este o exemplificare a ceea ce s-ar obtine cu 
doar doua profile). 

Tomografia computerizata are cateva neajunsuri ce deriva din faptul ca utilizeaza 
radiatia X, ceea ce face uneori dificil sa se vizualizeze tesuturile moi. Sunt situatii in 
care utilizarea unei alte metode - rezonanta magnetica nucleara - conduce la rezultate 
mai bune. Figura III. 2. 3. 6 ilustreaza aceste diferente. 
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Figura III.2.3.6. Diferente intre imagine obtinuta prin tomografie computerizata cu raze X 
(A) §i prin rezonanta magnetica nucleara (B) 

Rezonanta Magnetica Nucleara 

Rezonanta magnetica nucleara permite vizualizarea distributiei tesuturilor din 
sectiuni transversale “taiate” prin organele investigate (“felii” bi-dimensionale) - prin 
analogic cu tomografia computerizata cu raze X, se mai nume§te tomografie de 
rezonanta magnetica nucleara. Numele vine de la faptul ca se bazeaza pe un fenomen 
de rezonanta intre energia nucleelor atomice aflate intr-un camp magnetic §i radiatia 
electromagnetica cu frecventa specified fiecarui tip de atom. 

Principiul este ilustrat in figura III. 2. 3. 7 - se bazeaza pe momentul de spin care 
face ca atomii cu numar de ordine impar sa se comporte ca ni§te mici magneti. Introdu§i 
intr-un camp magneric exterior suficient de intens, ei tind sa se orienteze dupa directia 
campului §i apare o magnetizare a corpului investigat. La aparitia unui impuls de 
radiatie electromagnetica de frecventa potrivita, nucleele ce intra in rezonanta vor 
absorbi energia §i vor ocupa o noua pozitie (permisa din punct de vedere cuantic) - 
fenomenul se nume§te excitatie. 

La incetarea impulsului perturbator, nucleele vor tinde sa-§i reia vechea pozitie 
printr-o mi§care de precesie, emitand un semnal in radiofreeventa {frecventa Larmor) ce 
este functie de natura nucleelor, de combinatiile chimice §i de conditiile fizice in care 
acestea se afla. Aceasta revenire poarta numele de relaxare §i are (§i ea) durata in 
functie de proprietatile tesutului respectiv. Se masoara doi timpi de relaxare: Ti 
(relaxarea longitudinala sau spin-lattice ) §i T 2 (relaxarea transversala sau spin- spin). 

Utilizand succesiuni de impulsuri de excitare §i coroborand informatiile culese 
(frecventa Larmor, §i T 2 ) se obtine o vizualizare a distributiei tesuturilor precum §i a 
unor fenomene metabolice din sectiunile analizate. 
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The MR Image 



Tissue Characteristics 
Image Types 


Figura III.2.3.7. Ilustrarea principiului utilizat in rezonanta magnetica nucleara pentru 
vizualizarea distributiei tesuturilor moi §i a fenomenelor metabolice - preluat din [Van 
Bemmel&Musen 1997] 



Figura III.2.3.8. Exemplu de reconstructie a imaginilor 3-D (3-D rendering ) intr-o aplicatie 

de imagistica medicala 
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Aplicatiile imagistice actuale permit reconstructs tri-dimensionala pornind de la 
succesiuni de imagini bi-dimensionale - figura III.2.3.8. De multe ori se combina 
imagini obtinute prin tehnici diferite: tomografie cu raze X, rezonanta magnetica 
nucleara, radiografie, etc. De regula, astfel de aplicatii permit vizualizarea/ reconstructs 
unor noi sectiuni (ne-existente in investigatia initiala) prin combinarea informatiilor 
culese din surse diferite. 


Scintigrafia 

Principiul care sta la baza acestei metode imagistice este administrarea (prin 
injectare sau prin inhalare) a unor substante marcate radioactiv (substante radio- 
farmaceutice ) §i vizualizarea modului in care aceasta radioactivitate “interioara” se 
distribuie in organism. Avantajul este ca se pot obtine imagini dinamice §i functional 
pentru organul investigat. De aceea, metoda este foarte utila in investigatiile cardiace, 
iar sincronizarea achizitiei este controlata de semnalul ECG. De mai buna acuratete sunt 
dezvoltari ale metodei bazate pe principiile tomografice - SPECT (, Single Photon 
Emission Computed Tomography). 

O alta dezvoltare a metodei (de o acuratete mai mare §i potrivita pentru 
fenomene mai rapide) a produs o adevarata revolutie in investigatiile din neuro§tiinte: 
tomografia cu emisie de pozitroni - PET ( Positron Emission Tomography). Ea a permis 
vizualizarea proprietatilor dinamice ale proceselor biochimice din creier (figura 
III.2.3.9). 


Naive Practiced 

Anterior 




Novel 




Figura III.2.3.9. Investigarea activitatii creierului utilizand tehnica PET - Positron Emission Tomography. Se 
introduce in circuitul sanguin deoxiglucoza care se acumuleaza rapid in zonele creierului care au o activitate 

ridicata 


Ca §i in cazul celorlate metode de investigare, tehnicile scintigrafice permit 
reconstructs tri-dimensionala pornind de la succesiuni de imagini bi-dimensionale. 

Ecografia 

Tehnicile ecografice utilizeaza ultrasunete (unde cu frecvente peste 20 kHz) §i se 
bazeaza pe faptul ca viteza, impedanta caracteristica §i coeficientul de absorbtie difera 
functie de materialul (mediul) pe care acestea il traverseaza. Pentru generarea §i 
receptarea lor se folosesc traductori formati din cristale piezoelectrice ce pot vibra cu 
frecvente cuprinse intre 2 §i 1 0 MHz. 
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Datorita faptului ca rezolutia §i adancimea de penetrare a undelor impun cerinte 
contradictorii privind frecventa acestora, calitatea imaginilor este mai slaba decat a 
celor obtinute prin alte metode - figura III.2.3.10. 



Figura III.2.3.10. Imagini ecografice ale prostatei - calitatea este inferioara celei obtinute 
prin alte metode. Avantajul il constituie faptul ca metoda este mult mai putin invaziva decat 
radiatia X sau scintigrafia 


Pe langa structurile anatomice, ultrasunetele permit §i investigarea vitezei de 
deplasare a unor fluide (de exemplu sangele) prin utilizarea efectului Doppler. De 
regula, pentru investigatiile cardiace se utilizeaza combinatii intre imaginile anatomice 
§i cele dinamice. 

Fiind mai putin invazive ca alte metode (deci cu mai putine efecte secundare), 
investigatiile cu ultrasunete se utilizeaza in examinarile obstetrice §i ale nou-nascutilor, 
cele oftalmologice §i cardiace, ale creierului, etc. 


Termografia 

Corpul uman absoarbe radiatia in infra-ro§u aproape fara reflexie §i, in acela§i 
timp, emite radiatie in infra-ro§u ca o components a propriei energii termice. 
Intensitatea energiei radiante corespunde temperaturii suprafetei corpului respectiv. 
Pentru un subiect sanatos, temperatura corpului poate varia considerabil in timp, dar 
distributia temperaturii pe suprafata pielii pastreaza forme constante §i o simetrie 
bilaterala pronuntata. 

Tehnicile termografice permit vizualizarea acestor forme ("pattern" -uri) §i 
determinarea deviatiilor de la normal §i a schimbarilor patologice. Termograbil medical 
este constituit dintr-o camera in infra-rosu, care obtine o imagine video a distributiei 
temperaturii pe suprafata pielii. 

Termografia are cateva avantaje nete asupra celorlalte metode de obtinere a 
imaginilor in domeniul medical: este complet non-invaziva §i este un sistem in timp real 
(schimbarile pot ft sesizate cu o frecventa de o imagine pe secunda). Sigur, aceasta 
tehnica nu este comparabila cu radiografia in explorarea interiorului corpului uman, dar 
este complementara acesteia: radiografia furnizeaza informatie privind structurile 
anatomice, in timp ce termografia indica schimbari in procesele metabolice §i de 
circulatie. 

Tehnicile termografice sunt utilizate cu succes in investigarea problemelor de 
circulatie, reumatism, cancer de san, localizarea placentei in timpul sarcinii, 
identificarea §i localizarea unor tumori intraoculare §i orbitale. 
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2.4. Proiectul Visible Human 

Proiectul Visible Human a fost sponsorizat de U.S. National Library of Medicine 
cu scopul de a pune la dispozitia cercetatorilor un set de imagini de referinta ale 
corpului uman pentru: studii de anatomie, cercetare, dezvoltarea unor aplicatii pentru 
educatie, diagnostic §i planificarea tratamentelor, simulari, realitate virtuala. 

in prima faza s-au obtinut un set de imagini CT (tomografie computerizata), 
MRI (rezonanta magnetica nucleara) §i criosectiuni pentru: 

■ barbat - rezolutie 1mm (15 Gb) 

■ femeie - rezolutie 0.33mm (40 Gb) 



Figura III.2.4.1. Imagini realizate in cadrul proiectului Visible Human. 

Figura III.2.4.1 ilustreaza o criosectiune longitudinala cu evidentierea unor sectiuni 
transversale pentru care sunt prezentate imaginile CT §i MRI, precum §i o criosectiune 
la nivelul toracelui. 

Mai multe informatii gasiti pe site-ul dedicat acestui proiect §i dezvoltarilor sale 
ulterioare. Aceste dezvoltari cuprind aplicatii extrem de diverse: sisteme proto tip pentru 
screening (de exemplu in cancerul de colon), antrenarea pentru diverse proceduri 
chirurgicale (de exemplu cancerul de prostata, chirurgia estetica), sisteme educationale 
pentru disectii anatomice, sisteme de realitate virtuala, etc. 
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2.5. E§antionarea §1 CUANTIZAREA imaginilor 

Similar cu prelucrarea semnalelor, imaginile trebuiesc transformate intr-o 
versiune numerica (digitala) printr-un proces de e§antionare, respectiv cuantizare. 
Pentru a putea fi prelucrata numeric (digital), functia imagine f(x,y) va fi digitizata atat 
spatial, cat §i in amplitudine. 

E§antionarea §i cuantizarea uniforma 

Digitizarea coordonatelor spatiale (x,y) este numita e^antionarea imaginii. 
Digitizarea amplitudinii functiei f(x,y) este numita cuantizarea nivelelor de gri. 
Sa presupunem ca o imagine continua f(x,y) este aproximata prin e§antioane 
aranjate la intervale egale sub forma unui tablou de dimensiune N*M, unde fiecare 
element al tabloului reprezinta o cantitate discreta (o valoare numerica). Aceasta 
matrice se va numi imagine digitala : 

/ (0,0) / (0,1) ... f (0,M - 1) 

/ (1,0) f(U) 

f(x,y) = 

/(W -1,0) f(N- 1,1) ... f(N-l,M-D_ 

Fiecare element al tabloului poarta numele de element de imagine (picture 
element) sau pixel. Figura III. 2. 5.1 prezinta intuitiv notiunea de pixel §i analogul 
acesteia pentru spatiul tri-dimensional (voxel - volume element). 



Figura III.2.5.1. Elementele unei imagini bi-dimensionale pke// (a) §i ai unei imagini tri- 
dimensionale - voxeli (b). 

Exprimarea e§antionarii §i cuantizarii in termeni matematici formali este utila 
pentru prezentarile urmatoare. 

Fie Z multimea numerelor intregi, iar R multimea numerelor reale. Procesul de 
e§antionare poate fi privit ca o partitionare a planului vj printr-o grila in care 
coordonatele centrului fiecaruia din elementele grilei vor reprezenta o pereche de 
elemente ale produsului cartezian ZxZ (sau Z 2 ) - adica multimea tuturor perechilor 
ordonate de elemente (a,b), cu a,b e Z. 

De aici ,f(x,y) este o imagine digitala daca (x,y) sunt intregi din ZxZ §i/este o 
functie care atribuie fiecarei perechi (x,y) o valoare reprezentand nivelul de gri (un 
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numar apartinand multimii numerelor reale R). Daca nivelele de gri sunt de asemenea 
numere intregi, fimctia/va avea valorile in Z (a§a se intampla de obicei). 

Procesul de digitizare necesita stabilirea valorilor pentru fiecare pixel, in 
procesarea imaginilor digitale se obi§nuie§te ca aceste valori sa fie puteri ale lui 2: 

N = 2" M = 2 k 

?i 

G=r 

unde cu G s-a notat numarul nivelelor de gri. 

Vom presupune ca cele G valori atribuite pentru nivelele de gri sunt distribuite in 
mod egal (echidistant) intre 0 §i L pe scara de gri. Numarul de biti necesari pentru a 
memora o imagine digitala va fi dat de relatia: 

b=N*M*m 

Deoarece imagined digitala (matricea) reprezinta o aproximare a unei imagini 
reale continue, o intrebare se impune in acest moment: cat trebuie sa fie N fi M fi cate 
nivele de gri sunt necesare pentru o bund aproximare? 

Rezolutia unei imagini (masura in care se pot disceme detaliile) depinde 
puternic de ace§ti parametri - cu cat valorile alese pentru N(M) §i m sunt mai mari, cu 
atat imaginea digitala se va apropia mai mult de imaginea originala. 

Este dificil sa defmim o ’’imagine buna”, deoarece calitatea perceputa pentru o 
imagine este puternic subiectiva §i depinde in mare masura de cerintele aplicatiei care 
proceseaza imaginea. Figura III. 2. 5. 2 prezinta imagini cu rezolutie diferita. 

Imaginea din figura 111.2.5.2(a) are o rezolutie de 287*260 pixeli cu 256 (=2 8 ) 
nuante de gri, pentru ca in figura 111.2.5.2(b) rezolutia spatiala pe fiecare axa sa scada la 
jumatate §i apoi la o patrime din rezolutia initiala (c). Numarul nivelelor de gri a ramas 
constant in (a), (b) §i (c). Se poate observa cre§terea progresiva a granulatiei §i 
inrautatirea calitatii in delimitarea muchiilor. Sigur ca aceste detalii depind in mare 
masura §i de performantele echipamentului de tiparire, precum §i de marimea relativa a 
obiectelor din imagine. 

Plecand tot de la imaginea din figura 111.2.5.2(a), puteti vedea efectul scaderii 
numarului de nivele de gri la 16(=2 4 ) in (d); numarul acestora scade apoi la 2(=2 l ) 
nivele in imaginea (e), care este o imagine binara (in alb §i negru). in (d) §i (e) rezolutia 
spatiala a fost mentinuta constants, egala cu cea din imaginea initiala (a). Observati 
fenomenul de ’’falsa conturare” inca din figura 111.2.5.2(c), datorat insuficientei 
nivelelor de gri utilizate pentru reprezentare. 

Rezultatele prezentate arata efectele produse asupra calitatii imaginii de 
variatia lui N(M) §i m luate independent. Totu§i, aceste rezultate raspund doar partial 
intrebarii, pentru ca trebuie luata in considerare §i relatia dintre cei doi parametri, relatie 
exprimata de a§a-numitele curbe de izo-preferinta (corespunzatoare imaginilor de 
egala calitate subiectiva). 
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Figura III.2.5.2. Ilustrarea efectelor de schimbare a rezolutiei spatiale, respectiv a numarul de nivele de gri ale 
unei imagini (287*260 pixeli cu 256 nuante de gri). Prelucrare cu Image-Pro Plus v.3.0 


Concluziile unui studiu de izopreferinta arata urmatoarele [Gonzalez&Woods 

1992 ]: 

(1) A§a cum era de a§teptat, calitatea imaginii create cu cre§terea lui N(M) 
§i respectiv m. in unele cazuri totu§i, calitatea se imbunatate§te prin scaderea lui 
m - explicatia este ca prin scaderea lui m se produce o cre§tere a contrastului 
aparent din imagine. 
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(2) Curbele tind sa devina independente de m pe masura ce detaliile din 
imagine se inmultesc. Aceasta sugereaza faptul ca pentru imagini foarte detaliate 
sunt necesare putine nivele de gri (rezolutia spatiala este cea decisiva). 

(3) Curbele de izo-preferinta difera substantial de cele pentru care b 
(numarul de biti necesari pentru memorarea imaginii) este constant. 

Pentru o iluminare constants, sistemul vizual uman poate distinge aproximativ 
64 nivele de gri iar sistemele video standard sunt adaptate la aceasta valoare - valori 
exprimate pe 6 biti. 

E§antionarea §i cuantizarea neuniforma 

in unele situatii, pentru o rezolutie spatiala fixata (numar fix de pixeli in 
imagine), calitatea unei imagini poate fi imbunatatita prin utilizarea unei scheme 
adaptive la care procesul de e§antionare depinde de caracteristicile imaginii. 

in general, o e§antionare mai fma este necesara in vecinatatea tranzitiilor bru§te 
intre nivele de gri, in timp ce o e§antionare mai grosiera poate fi utilizata in zonele 
relativ uniforme. Sa consideram, de exemplu, o imagine ce consta dintr-o fata umana pe 
un fond uniform, in mod evident, fondul nu poarta multa informatie §i el poate fi 
reprezentat printr-o e§antionare de finete mai scazuta decat fata umana. E§antioanele 
(pixelii) ramase disponibile de la partea de fond pot fi utilizate pentru a obtine o finete 
mai ridicata in zona fetei §i astfel rezultatul de ansamblu se va imbunatati. in distributia 
e§antioanelor trebuie acordata o atentie mai mare zonelor de granita ale tranzitiilor 
dintre nivelele de gri. 

Necesitatea de a identifica in prealabil zonele de granita (chiar daca numai 
grosier) este in mod clar un dezavantaj al abordarii esantionarii neuniforme. De 
asemenea, aceasta metoda nu este practica pentru imaginile ce contin regiuni relativ 
mici. 

Cand numarul nivelelor de gri utilizate trebuie pastrat relativ redus, utilizarea 
unei cuantizari inegal distribuite a acestora este, de obicei, de dorit. O metoda similara 
celei descrise pentru e§antionarea neuniforma poate fi utilizata pentru distribuirea 
nivelelor de gri din imagine. Se vor utiliza putine nivele in vecinatatea granitelor §i mai 
multe nivele in zonele cu o variatie uniforma a nuantelor - astfel se vor reduce falsele 
contururi care apar in aceste zone atunci cand cuantizarea nu este suficient de fma. 

O tehnica atractiva in special pentru distribuirea nivelelor de gri consta in 
calcularea frecventei de aparitie a tuturor nivelelor de gri permise. Daca exista intervale 
ce contin nivele cu aparitie mai frecventa, in timp ce alte intervale sunt mai putin 
’’ocupate”, se va putea face o cuantizare mai fma in interiorul intervalelor M ocupate M §i 
una mai grosiera in celelalte subintervale din [0,L]. 

2.6. RELATII DE BAZA DINTRE PIXELI §1 OPERATII CU IMAGINI NUMERICE 

dupa [ Gonzalez &Woods 1992] 

Vom nota o imagine cu f(x,y). Cand ne vom referi la un pixel particular, vom 
utiliza litere mici ( p , q , etc). O submultime sau subset de pixeli din f(x,y) va fi notata cu 
5 . 

Un pixel p aflat la coordonatele (x,y) are: 

■ 4 vecini pe orizontala §i verticals 

(x+l,y) (x-l y y) (x,y+l) (x,y-l) 

aceasta multime se noteaza N 4 (p) §i se nume§te ’’vecinatate de 4 a lui p %% 

■ 4 vecini diagonali 

(x+l,y+l) (x+l f y-l) (x-l f y+l) (x-hy-1) 
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aceasta multime se noteaza N D (p) 

N 4 (p) §i Nf)( p ) formeaza un set numit N 8 (p) - "vecinatate de 8 a lui/? M 
O notatie uzuala pentru vecinii lui p din setul N 8 (p) este urmatoarea: 0=Est, 1=NE, 2=N, 
3=NW, 4=W, 5=SW, 6=S, 7=SE. 

3 2 1 

4 p 0 

5 6 7 


Conectivitate 

Conectivitatea dintre pixeli este un concept important utilizat in stabilirea 
granitelor dintre obiecte §i a componentelor regiunilor dintr-o imagine. 

Pentru a stabili daca doi pixeli sunt conectati, trebuie determinat daca ei sunt 
vecini intr-un anumit sens (sa zicem, sunt vecini in N 4 ) §i daca nivelul lor de gri 
satisface un anumit criteriu de similaritate (sa spunem, au aceea§i valoare). 

Consideram V ca fiind multimea valorilor nivelelor de gri utilizate pentru a 
defini criteriul de similaritate. De exemplu, intr-o imagine binara V={1} pentru 
conectivitatea pixelilor cu valoarea 1. in imagini cu o scara a nivelelor de gri, pentru 
conectivitatea pixelilor cu valori de intensitate intr-un interval. De exemplu, intre 32 §i 
64 vom considera V-{32, 33, ... , 63, 64}. 

Consideram 3 tipuri de conectivitate: 

(a) conectivitate 4 

Doi pixeli p §i q cu valori in V sunt 4-conectati daca q este in multimea 
N 4 (p). 

(b) conectivitate 8 

Doi pixeli p §i q cu valori in V sunt 8-conectati daca q este in multimea 
N 8 (p). 

(c) conectivitate m (conectivitate mixta) 

Doi pixeli p §i q cu valori in V sunt m-conectati daca: 

(1) q QStQm N 4 (p) 

sau 

(2) q este in N D (p) §i multimea N 4 (p)n N 4 (q) este vida (aceasta este 
multimea pixelilor care sunt vecini in N 4 atat pentru p, cat §i pentru q 
§i ale caror valori sunt in V). 

Conectivitatea mixta a fost introdusa ca o modificare a conectivitatii 8 in scopul 
eliminarii conexiunilor ce conduc la cai multiple §i care apar deseori atunci cand se 
utilizeaza conectivitate 8 - exemplul (b) prezentat in continuare: 


Oil 
0 10 

0 0 1 


0 

0 

0 



0 

0 

0 


1 


1 



0 

1 


(a) 


(b) 


(c) 
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Definitii 

Un pixel p este adiacent unui pixel q daca ei sunt conectati. 

Doua subseturi Sj §i S 2 ale imaginii sunt adiacente daca exista cel putin un pixel din S j 
adiacent cu un altul din S 2 . 

Un drum de la un pixel p cu coord. (x,y) la un pixel q cu coord. (s,t) este o 
secventa de pixeli distincti cu coordonatele 

(x 0 Jo), (x h yi), , (x n ,y n ) 

(x 0 ,yo)= (x,y) si (x n ,y n )= (s,t) 

(x b yi) este adiacent lui cu 1 <i <n\n- lungimea drumului dintre p 

§i q- 

Daca p §i q sunt pixeli dintr-un subset S al imaginii, atunci p este conectat cu q 
in S daca exista un drum de la p la q continut in intregime in S. 

Pentru orice pixel p din S , multimea pixelilor din S conectati cu p este numita 

componenta conectata a lui S. 

Notiunile de conectivitate , adiacenta §i drum sunt necesare la stabilirea 
proprietatilor unor obiecte din imagini (de exemplu la segmentare, calcul de distante, 
arii §i perimetre, etc.). Anumite pachete software de prelucrari de imagini ofera 
flexibilitate in stabilirea unor parametri la procesare. 

Masurarea distantei 

Consideram p, q §i z cu coord. (x,y), (s,t) §i (u,v) 

D este o functie distanta sau o metrica daca: 

(1) D(p,q) >0 cu D(p,q) = 0 daca p=q 

(2) D(p,q)=D(q,p) 

(3) D(p,z) <D(p,q) + D(q,z) 

Distanta euclideana 

’ D e (p,q) = l(x-s) 2 + (y-tff 2 

Deoarece x, y, s, t sunt de regula numere intregi, aplicarea distantei euclidiene este 
nepractica in prelucrarea imaginilor digitale. De aceea s-au definit alte tipuri de distanta, 
care au ca rezultat tot numere intregi. 

Distanta D 4 

D 4 (p, q) = |*-,sj + |;y-f| 

Exemplu : configuratia de pixeli pentru care distanta fata de (x,y) este D 4 < 2 

2 

2 12 

2 10 12 
2 12 

2 

Pixelii cu D 4 < 1 sunt in N 4 (x,y). 

Distanta D8 

D s i>,qj=max.i s >c-4,\y-t\^ 
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Exemplu : configuratia de pixeli pentru care distanta fata de (x,y) este D 8 < 2) 
vafi: 


2 2 2 2 2 

2 1112 

2 10 12 

2 1112 

2 2 2 2 2 

Pixelii cu D 8 < 1 sunt in N 8 (x,y). 

Lungimea drumului D 4 intre doua puncte este egala cu lungimea celui mai scurt drum 
intre cele doua puncte cu respectarea conventiilor pentru drum §i distanta. Acest lucru 
se aplica §i pentru D 8 . 


Operatii aritmetice §i logice 

Operatiile aritmetice §i logice sunt utilizate pe scara larga in prelucrarea 
imaginilor. Operatiile logice se aplica doar pe imagini binare, in timp ce operatiile 
aritmetice se aplica pe imagini cu mai multe nivele de gri. 

Operatiile aritmetice dintre doi pixeli p §i q sunt notate astfel: 
adunare: p+q 
scadere: p-q 

inmultire: p*q (sau pq sau pxq) 
impartire: p+q 

Operatiile aritmetice pe imagini intregi sunt efectuate pixel cu pixel. Principala 
utilizare a adunarii este aceea de mediere a imaginii in scopul reducerii zgomotului. 
Scaderea imaginilor este utilizata mult in imagistica medicala, ca instrument prin care 
se inlatura informatiile date de fondul static al imaginilor prelucrate (atunci cand acesta 
se cunoa§te). inmultirea imaginilor (sau impartirea) se utilizeaza pentru corectia 
umbrelor ce provin din neuniformitati in iluminare sau in sensibilitatea senzorului 
utilizat pentru achizitia imaginii. 

Operatiile aritmetice implica locatia spatiala a unui singur pixel la un moment 
dat, de aceea pot fi realizate M pe loc M : rezultatul efectuarii operatiei la locatia (x,y) poate 
fi memorata la acea locatie intr-una din imaginile existente (participante la operatia 
aritmetica), deoarece locatia respective nu va mai fi "vizitata" a doua oara. 

Operatiile logice utilizate in procesarea imaginilor sunt AND (“§i” logic), OR 
(“sau” logic) §i COMPLEMENT (negare logica), notate astfel: 


AND: p AND q (sau p • q ) 

OR: p OR q (sau p+q) 

COMPLEMENT: NOT p (sau ~p) 

Aceste operatii sunt complete din punct de vedere functional (pot fi combinate 
pentru a obtine orice alta operatie logica). 

Operatiile logice sunt instrumente de baza in prelucrarea imaginilor deoarece ele 
sunt utilizate pentru sarcini ca: mascarea, detectia caracteristicilor (" feature detection ") 
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§i analiza formelor. Ele sunt executate pixel cu pixel §i, la fel ca in cazul operatiilor 
aritmetice, pot fi executate "pe loc". 

Figura III.2.6.3 prezinta cateva exemple de operatii logice pe imagini binare. 

Pe langa prelucrarea unor intregi imagini, pixel cu pixel, operative aritmetice §i 
logice sunt utilizate §i in operatii orientate pe o vecinatate. Procesarea pe o vecinatate 
este formulata in contextul a§a-numitelor operatii cu "masca" - termenii de "tipar" 
(" template "), "fereastra" sau "filtru" sunt folositi pentru aceea§i notiune. 

Ideea care sta la baza acetui tip de operatii este de a permite ca valoarea unui 
pixel sa fie stability ca o functie dependents de nivelul de gri initial pentru pixelul 
respectiv, impreuna cu nivelele vecinilor acestuia. 



Figura III.2.6.3. Exemple de operatii logice pe imagini binare. De notat faptul ca negrul 
reprezinta in cazul acesta valoarea logica “adevarat” (sau 1) 


Ca exemplu, sa consideram o subimagine (a) in care dorim sa inlocuim 
valoarea lui Z 5 cu media pixelilor dintr-o regiune de 3 *3 pixeli centrati in z 5 , adica: 

z =-i 1+Z2+ ... +Z9 =-^ Zi 


9 


Q ^ 

y i = 1 
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zl 

z2 

z3 

wl 

w2 

w3 

z4 

z5 

z6 

w4 

w5 

w6 

z7 

z8 

z9 

w7 

w8 

w9 


(a) (b) 

Daca introducem masca de ponderare (b), vom putea nuanta “importanta” acordata 
valorilor de gri initiate pentru cei noua pixeli din vecinatatea considerate : o noua 
valoare a lui va fi media ponder ata: 

9 

z = w l z l +w 2 z 2 +.... + w 9 z 9 =Y J w iZ i 

i = 1 

Situatia precedenta (Z 5 media aritmetica) se va regasi ca un caz particular in care 
ponderile sunt toate egale: w,= 1/9, z=l,2,...,9. 

Geometria imaginilor 

Vom prezenta in cele ce urmeaza doar transformari de baza, fara a intra in 
probleme legate de transformarile de perspective. 

Materialul acestei sectiuni urmare§te doar sa dea o idee generate referitoare la 
formalizarea unor probleme ca translatia, scalarea sau rotirea imaginilor. 

Toate transformarile sunt prezentate in sistemul de coordonate cartezian tri- 
dimensional (3-D), in care coordonatele sunt notate cu (X,Y,Z). In mod uzual, 
coordonatele (X,Y,Z) se numesc " world coordinates" . 

Translatia 

Sa presupunem ca ne propunem sa translatam un punct de coordonate (X,Y,Z) 
intr-o noua locatie utilizand deplasamentele (X 0 , Y 0 ,Z 0 ). Translatia va fi realizata 
utilizand ecuatiile urmatoare (cea din dreapta reprezinta forma matriciala): 


X* = x + x 0 

V 


"l 

0 

0 

V 

~x~ 

Y 

r = Y+Y 0 

Y* 

= 

0 

1 

0 

y 0 

z 

Z — Z + Zq 

z* 


0 

0 

1 

Z 0 _ 

1 


unde (X ,Y ,Z ) sunt coordonatele noului punct, iar T se nume§te matrice de 
transformare. 

Se prefera utilizarea matricilor patrate: 


"v*" 


T 

0 

0 

V" 

"v“ 

Y* 


0 

l 

0 


Y 

Z* 


0 

0 

l 

Zo 

Z 

1 


0 

0 

0 

1 

1 


in mod similar se procedeaza pentru alte transformari geometrice (scalarea, 
rotirea). Este deseori util sa se utilizeze mai multe transformari pentru a se produce un 
rezultat compus, de exemplu translate, urmata de scalare §i apoi de rotatie. Utilizarea 
matricilor patrate simplified mult reprezentarea formala a acestui proces deoarece 
concatenarea transformarilor se face prin compunerea matricilor §i obtinerea unei 
matrici de transformare unice. 
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Pentru transformarile inverse se determina inversele matricilor de transformare 
(inversele matricilor corespunzatoare transformarilor mai complexe se obtin prin tehnici 
numerice). 

2 . 7 . IMBUNATATIREA IMAGINILOR §1 EXTRAGEREA UNOR ATRIBUTE 

Principalul obiectiv al tehnicilor de imbunatatire este acela de a prelucra o 
imagine in a§a fel incat rezultatul sa fie mai potrivit decat imaginea initiala pentru o 
anumita aplicatie - spunem ca sunt orientate pe problema (" problem-oriented "). 

De exemplu, o metoda foarte potrivita pentru imbunatatirea imaginilor obtinute 
cu raze X poate sa nu fie cea mai potrivita abordare in cazul imaginilor ecografice sau 
in prelucrarea imaginilor transmise de pe Marte. 

Abordarile discutate in acest capitol intra in doua categorii largi (analoage 
metodelor de la prelucrarile de semnale): metode in domeniul spatial §i metode in 
domeniul frecvential. 

Domeniul spatial se refera la planul imaginii, iar metodele din aceasta 
categorie sunt bazate pe manipularea directa a pixelilor din imagine. 

Domeniul fecvential cuprinde tehnicile bazate pe modificarea transformatei 
Fourier a imaginii. 

in cele ce urmeaza vom aborda doar metode din domeniul spatial. 


Metode spatiale 

Functiile de acest tip pot fi exprimate ca find: 

g(x,y) = T\f(x,y)_ 
unde f(x,y) este imaginea initiala 
g(x,y) imaginea procesata 

T este un operator pe/, definit pe o vecinatate a lui (x,y) 


v 



Centrul subimaginii este mutat pixel cu pixel pornind (de exemplu) din coltul stanga sus 
§i aplicand operatorul T pentru fiecare locatie. Aplicatiile de prelucrari de imagini 
utilizeaza tehnici de optimizare care reduc considerabil timpul de prelucrare. 
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Figura III.2.7.1. Negativul unei imagini - o transformare punctuala (noua valuare este in 
functie doar de valoarea de gri initiala §i nu este influentata de vecini). Prelucrare cu Image - 

Pro Plus v.3.0 


Imbunatatirea prin procesare punctuala 
Transformari asupra intensitatii - au ca formula generala: 
s=T(r) 

unde r este valoarea de gri initiala, iar s este rezultatul aplicarii operatorului T. 

La procesarile punctuale, noua valoare este functie doar de valoarea de gri initiala §i nu 
este influentata de vecini. 

■ negativul unei imagini - figura III.2.7. 1 . 

■ intarirea contrastului (" stretching ") - figura III.2.7.2. 



Figura III.2.7.2. intarirea contrastului ca transformare punctuala (aceea§i imagine initiala ca 
cea din figura 7.2 a). Imagine prelucrata cu Image-Pro Plus v.3.0 

■ impartirea in plane binare 



Figura III.2.7.3. impartirea unei imagini cu 256 nivele de gri in 8 plane binare 
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Sa presupunem ca valoarea fiecarui pixel din imagine este reprezentata pe 8 
biti (1 octet). Sa ne imaginam ca imaginea este compusa din 8 plane binare (cu valori 
reprezentate pe 1 bit) astfel incat fiecare plan contine bitii de un anumit rang - de la 
planul 0 (cel mai putin semnificativ) la planul 7 (cel mai semnificativ). Figura III.2.7.3 
ilustreaza aceasta impartire a unei imagini in plane binare numite ” bitplanes ". 

Figura III. 2. 7. 4 prezinta o imagine §i planele ei binare, incepand cu cel mai 
putin semnificativ. Observati ca doar datele din planele binare de ordin inalt (cele 4-5 
plane corespunzatoare bitilor cei mai semnificativi - planele [3,] 4, 5, 6, 7) contin 
informatie perceptibila, celelalte plane contin detalii de subtilitate. 



Figura III.2.7.4. Planele binare ale unei imagini §i modul cum este “distribuita” informatia utila din imagine 
intre planele de rand diferit. Imagine preluata §i prelucrata cu AIM-Another Image Manager (Universitatea din 

Amsterdam) 


Procesarea histogramei 


Histograma unei imagini digitale cu L nivele de gri (in domeniul [0 , L-l]) este o 
fimctie discreta: 


r k - nivelul de gri de ordinul k , cu k- 0, 1,2, ...., L-l 
n k - numarul de pixeli cu nivelul de gri de ordinul k 
n - numarul total de pixeli din imagine 
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Putem spune ca histograma p(r k ) ne da o estimare a probabilitatii de aparitie a 
nivelului de gri r k in imaginea studiata. 

O reprezentare grafica a acestei fimctii ne da o descriere globala a aspectului 
imaginii. De§i histograma unei imagini este o descriere care nu furnizeaza informatie 
privind continutul concret al unei imagini (figura III.2.7.5 ilustreaza acest lucru), alura 
histogramei unei imagini aduce informatie deosebit de pretioasa privind posibilitatea 
imbunatatirii contrastului. 




Figura III.2.7.5. Histograma ne da informatii privind utilizarea nivelelor de gri, nu 
continutul imaginii (imaginea §i rastumata ei au aceea§i histograma) 

Figura III. 2. 7. 6 prezinta histogramele pentru trei tipuri de imagini: o imagine 
(a) cu un contrast nu foarte bun (observati aglomerarea nivelelor de gri in centrul 
intervalului de valori, lucru deseori acceptabil pentru aplicatii uzuale) §i doua 
histograme ale unor imagini de slaba calitate - una foarte intunecata (b) §i una extrem de 
luminoasa (c). 

O metoda de imbunatatire bazata pe utilizarea histogramei §i larg utilizata 
pentru anumite tipuri de imagini este cea de egalizare a histogramei (ilustrata in figura 
III.2.7.7), in fapt o egalizare/redistribuire a utilizarii nivelelor de gri in imagine. 
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Figura III.2.7.6. Histograme pentru imagini cu un contrast scazut (o utilizare ne-eficienta a plajei de gri): 
imagine ce utilizeaza doar nivelele de la mijlocul plajei (a); imagine foarte intunecata (b); imagine foarte 

luminoasa/spalacita (c) 


Principiul metodei urmare§te o uniformizare a densitatii de probabilitate pe 
domeniul nivelelor de gri - o repartizare uniforma a acestora in domeniul [0,L-1]. 

Figura III.2.7.7 prezinta rezultate obtinute aplicand aceasta metoda la 
prelucrarea unor imagini de pe Marte. 



(a) 



Figura III.2.7.7. Efectul egalizarii histogramei - informatiile ies la iveala. Histograma (a) 
pentru imaginea initiala din stanga arata utilizarea aproape exclusiva a nuantelor foarte 
inchise §i a§a de apropiate pe scara de gri incat sistemul vizual uman nu le poate distinge. 
Nivelele de gri sunt redistribute pe plaja disponibila (b), astfel incat distanta dintre doua 
valori consecutive create §i ele pot fi percepute ca nuante distincte (imaginea din dreapta). 
Imagine preluata §i prelucrata cu AIM-Another Image Manager (Universitatea din 

Amsterdam) 
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Filtrarea spatiala 

Filtrele liniare folosesc o "masca" (b) pentru determinarea unei noi valori a 
pixelului z 5 din centrul unei vecinatati (a) ca o relatie liniara intre valorile de gri initiate 
Zi §i ponderile w t ce exprima relatia dorita intre pixeli.: 

9 

R = w t z, + w 2 z 2 + .... + w 9 z 9 = Yj w i z i 


zl 

z2 

z3 

wl 

w2 

w3 

z4 

z5 

z6 

w4 

w5 

w6 

z7 

z8 

z9 

w7 

w8 

w9 


(a) (b) 

Filtrele neliniare utilizeaza functii neliniare pentru determinarea noii valori 
din centrul unei vecinatati - de exemplu, pentru valoarea maxima din centrul unei 
vecinatati de 3*3 pixeli: 

R = max tj . \k = 1,2, ....,9 

Similar se utilizeaza §i alte functii: valoarea minima, mediana, etc. 


Filtre pentru netezire 

Acest tip de filtrare este prezentat in figura III.2.7.8 - are efect de inceto§are §i 
voalare a contururilor (blurring). De aceea, filtrele de netezire se mai numesc ’’filtre 
integrative”, in cazul filtrelor liniare, ponderile sunt pozitive la acest tip de filtrare. 

Observati ca cele trei metode de netezire din figura III. 2. 7. 8 nu dau rezultate 
identice pe cele doua imagini: la imaginea cu zgomot uniform, filtrarea mediana nu pare 
sa dea rezultate spectaculoase, pe cand la imaginea afectata de zgomot binar filtrarea 
mediana pare cea mai performanta. Explicatia se gase§te in modul in care este ales 
indicatorul tendintei centrale pentru cele doua tipuri de distribute ale zgomotului (vezi 
capitolul de prelucrari statistice). 

Aici s-au ilustrat doar situatii simple, in care doar distributia valorilor 
zgomotului difera (distribute uniforma, respectiv binara), utilizandu-se o distribute 
spatiala uniforma. Prelucrarile devin mai complexe cand distributia pixelilor zgomoto§i 
este neuniforma spatial; in acela§i timp, valorilor de gri pot urma diverse distribute, mai 
complexe decat cele ilustrate aici. 


Filtre derivative 

Filtrele derivative utilizeaza ma§ti cu ponderi negative §i pozitive care conduc 
la o “derivare” a imaginii, punand in evidenta tranzitiile §i schimbarile de 
comportament ale functiei imagine (detaliile de finete §i tranzitiile intre nivelele de gri). 

Figura III. 2. 7. 9 prezinta rezultatul aplicarii unui filtru de tip gradient (o 
derivata de ordinul I), iar figura III. 2. 7. 10 a unui filtru Faplace (o derivata de ordinul 
II). 
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Figura III.2.7.8. Efectul filtrelor de netezire. Imaginile (a) §i (e) sunt cele originate, cu 
acela§i nivel de zgomot adaugat in mod uniform din punct de vedere spatial - imaginii (a) i 
s-a adaugat zgomot cu valori intre 0 §i 255 distribuit in mod uniform pe plaja de gri (adica 
toate nuantele de gri), in timp ce imaginii (e) i s-a suprapus zgomot binar, de tip “sare §i 
piper” (doar extremele de 0 §i 255). Filtrele aplicate au fost: netezire uniforma in (b) §i (f); 
netezire Gausiana in (d) §i (h); filtrare mediana in (c) §i (g). Imagine prelucrata cu Image - 

Pro Plus v.3.0 
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(a) 

Figura III.2.7.10. Rezultatul aplicarii unui filtru Laplace. Imagine prelucrata cu Image-Pro 

Plus v.3.0 


Se observa modul diferit de evidentiere a muchiilor pentru cele doua tipuri de filtre 
derivative (de ordinul I sau II). 

Prezentarea unor probleme elementare din prelucrarea imaginilor a avut scopul 
de a ajuta la formarea unei idei generale privind problematica domeniului. Totodata, 
credem ca aceste notiuni de baza vor constitui fundamental necesar atat pentru a putea 
alege unele din optiunile oferite de programele de prelucrare, cat §i pentru studierea mai 
aprofundata a problemelor specifice imagisticii medicale. 
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2.8. Standardul DICOM 
Digital Imaging and Communications in Medicine 



Standardul DICOM faciliteaza interoperabilitatea echipamentelor de imagistica 
medicala — standardul specifica: 

■ un set de protocoale ce trebuiesc respectate de catre toate echipamentele care 
pretind ca sunt conforme standardului 

■ sintaxa §i semantica comenzilor, precum §i informatia asociata acestor 
protocoale 

■ informative ce trebuiesc fiirnizate de catre echipamentele ce se conformeaza 
standardului 



Figura III.2.8.1. Datele fiimizate de echipamentele de imagistica medicala trebuie sa se 
integreze in circuitul general al informatiei medicale. [DICOM] 
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Scurt istoric 

■ anii 1970 — introducerea tomografiei computerizate, urmata de dezvoltarea 
altor tehnici de investigare imagistica — nevoia unor standarde de transfer a 
imaginilor §i informatiei asociate acestora intre echipamentele furnizate de 
diver§i producatori 

■ 1983 — American College of Radiology (ACR) §i National Electrical 
Manufacturers Association (NEMA) formeaza un comitet care dezvolta 
standardul DICOM (dezvoltat §i publicat potrivit standardelor NEMA §i in 
acord cu directi vele ISO/IEC) 

Standardul a fost dezvoltat impreuna cu alte organizatii internationale de 
standardizare 

CEN TC25 1 - Europa 
JIRA Japonia 
IEEE 
HL7 

ANSI - SUA 

■ 1988 - DICOM versiunea 2 

■ 2001 - DICOM versiunea 3 (publicata de NEMA). 


Standardul DICOM v.3 este aplicabil in retele (respecta protocoalele standard de retea 
OSI §i TCP/IP) realizand interoperabilitatea completa intre sistemele conectate in retea 
(figura III. 2. 8. 2). 


Medical Imaging Application 


DICOM Application Emily 

L 



OSI Upper 
Layer 
Service 
boundafy 


Point-to-poim NetArar^ed en'jircnrieni 

en^iroinnent 


Figura III.2.8.2. Standardul DICOM permite conectarea echipamentelor de imagistica 
medicala in retea §i interoperabilitatea cu celelalte echipamente medicale. [DICOM] 
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DICOM versiunea 3: 

■ specifica clar clasele de servicii, semantica comenzilor §i tipurile de date => 
modul in care trebuie sa reactioneze dispozitivele care pretind ca respecta 
standardul 

■ specifica nivele de conformare cu standardul 

■ are organizare modulara - se pot adauga noi facilitati 

■ introduce in mod explicit “ Information Objects ” nu numai pentru imagini §i 
grafica, ci §i pentru studii, rapoarte, etc. 

■ precizeaza tehnica pentru identificarea neambigua a relatiilor dintre diferitele 
informatii (“ Information Objects ”) din retea. 



Figura III.2.8.3. Standardul DICOM are organizare modulara §i ofera flexibilitate, conectand 
in mod natural imaginile cu celelate informatii medicale. [DICOM] 


Mai multe informatii se pot afla de pe diferite site-uri specializate - o buna sursa este 
Penn State Radiology. 
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Partea a IV-a 


DECfflA MEDIC ALA 
ASISTATA DE CALCULATOR 




INTRODUCERE 


Asistam azi la extinderea utilizarii calculatoarelor in cele mai diverse domenii, 
medicina fund un domeniu vizat inca de la aparitia primelor calculatoare. Atractia pentru 
medicina nu este intamplatoare: informaticienii primelor generatii de calculatoare simteau 
nevoia de a demonstra universalitatea aplicatiilor §i doreau exemple in afara granitelor 
traditionale ale disciplinelor "exacte" in care formalizarea matematica lasa sa se intrevada 
u§or aplicatiile. Pentru un nespecialist, activitatea medicului la stabilirea diagnosticului pare 
un simplu proces de asociere a unui termen, numit "diagnostic", cu un set de elemente 
numite "simptome". in primele programe de diagnostic asistat s-a procedat similar, insa 
rezultatele obtinute au fost deosebit de modeste. La o analiza mai atenta se poate vedea ca 
nici nu se puteau a§tepta rezultate mai bune intr-o viziune atat de simplista. Multe semne nu 
pot fi incadrate intr-o logica bivalenta, nu toate semnele apar cu necesitate, nu toate au 
aceea§i valoare in stabilirea diagnosticului; in plus, exista frecvente complicate sau asocieri 
care fac ca multimea diagnosticelor sa fie greu de definit. Peste toate acestea s-a adaugat §i 
constatarea ca rationamentul medicului se deosebe§te substantial de rationamentul liniar 
deductiv-exclusiv, fiind considerat oarecum mai apropiat de procesul de recunoa§tere. 
Actualmente rationamentul medical se gase§te sub lupa speciali§tilor in inteligenta 
artificiala §i reprezentarea cuno§tintelor, ca §i a celor interesati in §tiinte cognitive. S-a 
progresat foarte mult in aceasta directie, cadrul de dezvoltare, mult mai larg decat cel 
strict limitat la "diagnosticul asistat", fiind oferit de logica matematica, ce permite 
formalizarea cuno§tintelor in general. Aparitia limbajelor logice - de exemplu PROLOG - a 
deschis efectiv un nou mare capitol al information medicale: "decizia medicala asistata de 
calculator", care alaturi de aplicatiile privind prelucrarea semnalelor §i imaginilor, bazele de 
date §i sistemele informatice medicale, biostatistica §i modelarea proceselor biologice, 
constituie domenii care i§i schimba incetul cu incetul statutul din domenii de varf in 
domenii de rutina. Ritmul ridicat in care apar noi programe in aceste discipline face insa ca 
sa fie tot mai dificil de tinut pasul cu noutatile mai ales cand ele cu greu i§i fac loc in 
programele traditionale ale invatamantului medical. 

Aplicatiile practice privind asistarea deciziei medicale nu s-au limitat la cele 
privind diagnosticul asistat, acoperind §i alte aspecte. Putem distinge astefel urmatoarele 
directii: 

a) diagnostic asistat 

b) alegerea investigatiilor 

c) optimizarea tratamentului 

d) asistarea deciziei in managementul sanitar. 

Vom analiza pe rand aceste aspecte, tratand mai detaliat aplicatiile in domeniul 
diagnosticului asistat. 
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1. DIAGNOSTICUL ASISTAT DE CALCULATOR 

1.1. CLASIFICAREA METODELOR DE DIAGNOSTIC 

Rezultatele modeste ale primelor programe de diagnostic "automat" (denumire la 
care actualmente s-a renuntat) nu au determinat insa o a abandonare a temei, ci tocmai o 
cre§tere a eforturilor de analiza aprofundata a rationamentului medical, cu ecou pana la 
dezvoltarea unor abordari teoretice de finete. Se pot distinge trei directii principale de 
studiu: 

• imbunatatirea metodelor logice prin care s-a pomit initial abordarea diagnosticului 
asistat 

• elaborarea unor metode statistice adecvate, conducand pana la teoria clasificarii 

• formalizarea cuno§tintelor medicale in forma lor euristicd , cu scopul direct declarat de 
simulare a rationamentului medical, conducand la elaborarea sistemelor expert. 

in continuare vom prezenta stadiul actual al cercetarilor in acest domeniu §i vom 
sistematiza metodele abordate, de§i unele metode au caracter hibrid §i sunt greu de 
clasificat. Totodata, prezentarea se va face evitand abordarea teoretica, incercand a expune 
intr-o maniera descriptiva cele mai importante directii de dezvoltare a "diagnosticului 
asistat de calculator". 

1.2. Formalizarea operatiunii de stabilire a diagnosticului 

Operatiunea de stabilire a diagnosticului poate fi privita ca rezultatul confruntarii 
comparative de catre medic a doua fluxuri de informatie: 

- informatii privind starea pacientului, obtinute atat prin dialog direct (anamneza) cat §i prin 
diverse investigatii (laborator, radiografii, explorari fiinctionale etc.): ansamblul acestor 
informatii, cu valori concrete pentru pacientul investigat (simptome) le numim date. 

- informatii pe care medicul le poseda (din pregatire, din experienta clinica, din materiale 
documentare etc.) §i pe care le numim cuno§tinte , cuprind o multitudine de relatii intre 
simptome §i diagnostice. 

Operatiunea de stabilire a diagnosticului este prezentata schematic in fig. IV. 1 . 



Figura IV. 1. Reprezentarea schematic^ a fluxurilor informationale in operatia de stabilire a 

diagnosticului 


Realizarea unor programe de calculator pentru "diagnostic asistat" trebuie sa 
urmareasca deci confruntarea celor doua fluxuri de informatii: 
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- cuno§tintele din domeniu, care formeaza un ansamblu numit baza de cuno§tinte 

(BC) 

- datele despre pacient, anasamblu numit §i vectorul de stare al pacientului 

(PAC). 

Metodele de diagnostic enumerate mai sus se deosebesc intre ele prin modul in 
care este construita baza de cuno§tinte, modul de culegere (reprezentare) a datelor 
pacientului §i modul de confruntare date-cuno§tinte (rationament). 

Sa le abordam pe rand. 


2. METODE LOGICE 

2.1. Baza de cuno§tine 

Metodele logice folosesc drept baza de cuno§tinte o matrice boli/simptome (Tabel 

IV.l). 


Tabel IV. 1. Structure bazei de cunostinte pentru metodele logice in diagnosticul asistat 


^^^ijngtome 

Diagnostice 

Si 

s 2 

S 3 


s m 

D, (Hipertiroidism) 

0 

1 

0(n) 


1 

D 2 (Hipertensiune) 

1 

0 

1 


0(n) 







D n (Angina pectorala) 

1 

1 

0 


0(n) 


D], D 2 ... D n reprezinta diagnostice iar S b S 2 ... S m reprezinta simptome. Ex: S] = hipertrofie 


ventriculara stanga, S 2 = palpitatii, S 3 = cefalee,... S m = exoftalmie 

Matricea este construita pe baza logicii bivalente (de unde §i denumirea de metode 
’’logice”), valoarea ”1” reprezentand prezenta simptomului in diagnosticul respectiv, iar 
valoarea ”0” absenta. (in variantele mai noi se utilizeaza §i ”n” cu semnificatia ”nu are 
importanta”, adica prezenta/absenta simptomului respectiv este nerelevanta pentru acel 
diagnostic). 

Continutul acestul tabel este realizat prin contributia unui grup de experti §i este 
reprezentat in program sub forma unei matrici, fiecare element din matrice fiind 
caracterizat prin doi indici: unul referitor la boala, celalalt la simptom. 

2.2. Variante de metode logice 

in metodele logice vectorul de stare al pacientului este format dintr-un §ir de 
valori corespunzatoare tuturor simptomelor existente in baza de cunostinte. La lansarea 
programului vectorul PAC contine ”0” in toate casutele. 

Dupa modul de constructs al vectorului de stare al pacientului distingem doua 
variante mai insemnate de metode logice. 
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a) Tabele de adevar 

Simptomele sunt clasificate §i prezentate pe mai multe pagini de ecran. De obicei 
selectia se efectueaza prin deplasarea pe ecran a unui cursor pana la simptomul ales §i 
apasarea unei taste de selectie (de obicei '’Enter”); se deplaseaza apoi cursorul pe alta 
pozitie §i a§a mai departe. Pentru simptomele selectate vectorul de stare al pacientului va 
confine ”1", restul casutelor ramanand "0". Majoritatea programelor mentin cel putin o 
linie "menu" in tot timpul rularii pentru precizarea modului de lucru in secventa 
corespunzatoare din program. 

b) Arbori de decizie 

Pentru o apropiere mai mare de clasica anamneza, in loc de selectarea de pe ecran 
a simptomelor, programul afi§eaza succesiv intrebari privind prezenta / absenta unor 
simptome, solicitand raspuns de tip da/nu. in cazul unui raspuns pozitiv, in vectorul de stare 
al pacientului apare "1" in pozitia simptomului respectiv. 

Varianta "arbori de decizie" impune alegerea succesiunii intrebarilor in functie de 
raspunsurile primite, evitarea intrebarilor inutile, (de ex. intrebari despre sarcina la un 
barbat etc.). Se apreciaza ca prin utilizarea arborilor de decizie, lasand pacientul insu§i sa 
raspunda la unele intrebari se poate obtine o mai putemica implicare a sa, cu rezultate 
pozitive in tratament. 

2.3. Prezentarea rezultatelor 

Indiferent de varianta prin care se construie§te vectorul de stare al pacientului, in 
continuare acesta este comparat cu fiecare linie a matricii boli/simptome §i se calculeaza 
cate din simptomele caracteristice bolii respective sunt prezente la pacient. De exemplu, 
daca boala D, are 8 simptome caracteristice (8 valori notate cu "1" in BC), iar pacientul 
nostra prezinta 6 dintre acestea, atunci procentul de simptome ale bolii D, prezente la 
pacient este 6/8 = 75%. 

Prezentarea rezultatului poate fi efectuata in mai multe feluri: 

a) prin enumerarea tuturor diagnosticelor in care apar semnele pacientului, in lista 
afiliata diagnosticele sunt ordonate dupa numaral de simptome care coincid; 

b) prin calcularea unui procent de coincidence §i ordonarea diagnosticelor dupa 
acest procent; 

c) prezentarea pentru fiecare diagnostic din lista-rezultat nu numai a numaralui de 
simptome coincidente, ci §i a simptomelor care ar mai fi a§teptate pentru un tablou clinic 
clasic complet; 

d) varianta anterioara imbunatatita ar include elemente de diagnostic diferential 

sugerate; 

e) prezentarea alaturi de fiecare diagnostic din lista-rezultat a unor indicatii 
terapeutice. 

2.4. Dezavantajele metodelor logice 

Metodele logice, datorita simplitatii lor prezinta o atractie pentru utilizatori, mai 
ales metoda tabelelor de adevar care permite §i o ralare operativa. Totu§i, simplificarile, 
uneori excesive, restrang utilitatea practica impingand aplicatiile preponderent in sfera 
invatamantului medical. Obiectiile ce pot fi aduse se refera mai mult la doua aspecte: 

- logica bivalenta de genul "simptomul este prezent/absent" exclude factoral 
intensitate; intr-adevar, o serie de simptome pot fi apreciate ca avand diferite intensitati (ex: 
febra ridicata / moderata/ u§oara sau parametri exprimabili numeric) 
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- ponderea simptomelor in aprecierea unui diagnostic nu este egala (de ex: 
concentratia scazuta de hemoglobina este un indicator mai putemic pentru anemie decat 
paloarea) 

- nu toate simptomele apar cu necesitate; exista numeroase forme atipice sau 
asimptomatice 

- metodele logice nu iau in considerare "prevalenta" afectiunilor (acest aspect 
deseori nu reprezinta un dezavantaj ci chiar un avantaj, sugerand §i posibilitatea unei 
afectiuni mai rare). 

Corectarea acestor neajunsuri a impus dezvoltarea unor metode ce depa§esc 
cadrul logicii bivalente §i care vor fi prezentate in continuare. 


3. METODE STATISTICE. REGULA LUI BAYES 

3.1. ASPECTE STATISTICE IN RATIONAMENTUL MEDICAL 

O caracteristica esentiala a domeniului medical este faptul ca majoritatea 
aspectelor intalnite au un aspect probabilistic: rareori putem folosi termenii "intotdeauna" 
sau "niciodata", dar ne intalnim frecvent cu termenii "adesea", "uneori", "rareori". Expresia 
probabilistica a terminologiei medicale este uneori acoperirea lacunelor cuno§tintelor 
disponibile care fac deocamdata imposibila dihotomia necesara inlaturarii unor ambiguitati, 
dar trebuie sa fim permanent con§tienti de caracterul statistic intrinsec al multor fenomene 
biologice, caracterul statistic fiind prezent inca de la nivel molecular, a§a ca ecoul la nivel 
macroscopic nu este surprinzator. Abordarea probabilistica in medicina este un mod de 
gandire impus inca din faza de formare a viitorului medic, chiar daca deocamdata este 
limitat in buna parte la utilizarea terminologiei "vagi" §i mai putin la gandirea statistics 
propriu-zisS. Faptul ca aspectul probabilist este fundamental in gandirea medicals a 
determinat dezvoltarea metodelor statistice de decizie medicala asistatS, fiind nucleul unor 
metode care au depart cadrul statistic propriu-zis. 

Abordarea statistics poate fi recomandabilS §i in situatii in care caracterul 
intrinsec al aspectului nu este statistic, cum ar fi exprimarea intensitatii unui simptom sau 
ponderea simptomului pentru un anumit diagnostic. 

Abordarile statistice s-au orientat in doua directii principale: 

- regula lui Bayes 

- pattern recognition. 

3.2. Regula lui Bayes 

Punctul de plecare al metodelor numite "bayesiene" il constituie faptul ca prezenta 
unui simptom intr-o boala poate fi dat cu o anumita probabilitate p(s+/b+), element 
fundamental deosebit de metodele logice in care simptomul putea fi doar prezent sau 
absent. 

De asemenea, un simptom poate fi prezent in mai multe boli, deci se poate stabili 
o probabilitate de a gasi simptomul intr-o populatie, p(s+), indiferent de bolile cu care se 
asociaza. Nu trebuie sa uitam §i faptul ca frecventa bolilor intr-o populatie poate fi 
caracterizata printr-o probabilitate p(b+). Deci intalnirea unui simptom trebuie sa ne 
sugereze posibilitatea unei boli cu o probabilitate p(b+/s+) dependents de probabilitatile 
enumerate anterior. 

Putem calcula ponderea simptomului s pentru diagnosticul bolii b dupa formula: 

p(b+/s+) = p(s+/b+) x p(b+)/p(s+) (IV. 1) 

cunoscuta sub numele de "regula lui Bayes". Probabilitatile din membrul drept se considera 
cunoscute pentru un anumit teritoriu intr-un anumit moment. Ele ar putea fi cunoscute 
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printr-o analiza populationala (screening) sail prin evaluarea datelor de morbiditate pentra 
p(b+) §i din aprecierile unor experti pentru p(s+/b+) §i p(s+). Literatura de specialitate 
apreciaza ca deocamdata ultimele doua probabilitati, in special p(s+), sunt cunoscute destul 
de aproximativ, limitand sau ingreunand aplicabilitatea metodei. 

Tab el IV. 2. Tabel ilustrand frecventele cu care poate sa apara intr-o populatie o 
anumita boala b §i relatia ei cu simptomul s; tabele similare trebuie concepute pentru orice 
pereche b-s. in dreapta sunt prezentate ca exemplu probabilitatile neconditionate p(s+) §i 
p(b+) §i conditionate p(s+/b+), din care se va calcula p(b+/s+) 



s + s - 


b + 
b - 

a b 

c d 

LI p(s+) = Cl/N 

L2 p(b+) = Ll/N 

p(s+/b+) = a/Ll 


Cl C2 

N p(b+/s+)=a/Cl 


De exemplu, sa luam o situatie ce ar putea aparea la analiza fi§elor unui e§antion 
de 4000 de indivizi. Dorim realizarea unui tabel ca tabelul IV.3 pentru o anumita boala (sa 
zicem b = "viroza") §i un anumit simptom (sa zicem s = "febra"). Din cei 4000 indivizi, in 
cursul anului precedent s-a semnalat prezenta virozei la 100 de persoane; dintre acestea 
numai 80 au prezentat febra. De asemenea mai putem gasi ca febra a fost semnalata §i la 
alte 70 de persoane care nu au avut viroza (dar poate au avut pneumonie, bron§ita etc.). 
Trebuie subliniat ca cele 3900 persoane care nu au avut viroza nu sunt presupuse sanatoase, 
cuprinzand atat persoane sanatoase cat §i persoane cu alte diagnostice; in tabelul nostru 
conteaza aici numai proprietatea M nu au avut viroza (b-)". 

Tabel IV.3 Exemplu pentm ilustrarea regulii lui Bayes 



s + 

s - 


b + 

80 

20 

100 

b- 

70 

3850 

3900 


150 

3850 

4000 


Reluand cele expuse: in total au avut viroza 100 de persoane din 4000, adica 
p(b+) = 100/4000; au avut febra 150 din 4000, adica p (s+) = 150/4000 etc. Aceste 
probabilitati (p(b+), p(b-), p(s+), p(s-)) se numesc probabilitati neconditionate , toate acestea 
avand la numitor numaral total al indivizilor (N=4000). 

In cazul in care facem referire numai la o parte dintre ei (de ex. dintre cei care au 
avut viroza), atunci obtinem probabilitati conditionate. lata un exemplu: din cei 100 care au 
avut viroza, 80 au prezentat febra, adica p(s+/b+) = 80/100; similar putem scrie orice 
probabilitate conditional; alt exemplu: din cei 3850 care nu au febra, 20 au avut viroza, 
adica p(b+/s-) = 20/3850. De obicei, o probabilitate conditional, de exemplu (p(b+/s-), se 
cite§te ’’probabilitatea ca un individ sa aibe viroza (b+) daca el nu are febra (/s-)". 

Cand avem la dispozitie un astfel de tabel putem calcula direct p(b+/s+), dar de 
obicei astfel de tabele nu sunt disponibile. De aceea folosim regula lui Bazes in care 
inlocuim p(b+), p(s+) §i p(s+/b+) considerate din estimari in functie de acestea doua 
(p(s+)). Putem astfel calcula: p(b+/s+) = 80/150. Aceasta probabilitate reprezinta pentru 
programele de diagnostic asistat un element important deoarece ea arata cat de mult 
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contribuie faptul ca un individ prezinta "febra" pentru a inclina spre diagnosticul de 
"viroza”. 

Pentru a stabili probabilitatea de a avea o anumita boala, trebuie sa construim cate 
un tabel de genul tabelului III.3 pentru fiecare simptom; de fapt se construiesc tabele doar 
pentru simptomele caracteristice de§i actualmente dispunem de un numar relativ scazut de 
date concrete. 

Principial, termenii sunt accesibili, astfel meat ii putem considera pentru moment 
cunoscuti. Daca am dispune de baze de date suficient de bogate, ace§ti termeni ar putea fi 
calculati. Avem deci o evaluare a ponderilor simptomelor cu care am putea estima 
probabilitatea unui anumit diagnostic; cateva simptome cu ponderi ridicate ar conduce la 
un diagnostic foarte probabil. Din pacate, se mai impune o regula: pentru ca aceste ponderi 
sa fie combinate pentru mai multe simptome, este necesar ca simptomele sa fie 
independente; ori, este cunoscut faptul ca, foarte frecvent simptomele sunt corelate nu 
intamplator, ci printr-o interdependent^ cauzala; utilizarea simultana a unor simptome 
putemic corelate conduce la cre§terea artificiala a probabilitatii unui diagnostic. Pentru 
evitarea acestor situatii se pot aplica teste de independents (% 2 = patrat) din care se pot 
elimina simptomele redondante. 

Cu toate dificultatile sale, regula lui Bayes a impus un punct de vedere mai realist, 
introducand §i o discipline in elaborarea metodelor de diagnostic asistat. 


4. PATTERN RECOGNITION 

4.1. Principiul metodei “patern recognition” 

Am pastrat denumirea originala a metodei deoarece traducerea uzuala ca 
"recunoa§terea formelor” este nepotriviti, mai ales in contextul diagnosticului asistat. 
Termenul de ’'pattern” trebuie inteles ca un set de atribute caracteristice, neavand aici 
sensul de forma. De§i este o metoda cu caracter statistic, principiul aplicarii sale este 
fundamental diferit de cel al regulii lui Bayes. 

Metoda "pattern recognition" face un pas insemnat spre apropierea de 
rationamentul medicului. Suntem de fapt obi§nuiti cu operatiunea de recuno§tere pe care o 
utilizam frecvent; recunoa§tem o persoana intr-o fotografie, recunoa§tem o voce, un mers, 
un obiect, o stare de spirit a unei persoane etc. Pe ce ne bazam in aceste recunoa§teri? 
Analiza procesului de recunoa§tere sta la baza metodei pe care o descriem in continuare. 

Orice sistem sau obiect poate fi caracterizat printr-o imensitate de caracteristici 
exprimabile cantitativ sau calitativ care formeaza o multime a proprietatilor, M. De 
exemplu, pentru o persoana aceasta multime ar cuprinde: inaltimea, greutatea, varsta, sexul, 
frecventa cardiaca, tensiunea sistolica, tensiunea diastolica, glicemia, proteinemia, 
proteinuria, pH-ul sanguin, numarul de respiratii pe minut, indicele de memorie etc., etc. 
Unele marimi nu se modified (sexul, inaltimea la adult), altele se modified lent (greutatea), 
altele au variatii dependente de starea organismului (frecventa cardiaca). 

Deci valorile proprietatilor trebuie privite dinamic. 

Indivizii (sau obiectele) unei populatii pot fi impartiti in clase dupa diferite 
criterii; de exmplu: dupa sex se impart in barbati §i femei; dupa varsta: copii §i adulti fund 
posibil a diviza fiecare clasa in subclase (ex: adulti tineri, maturi §i varstnici). Criteriile de 
includere a unui obiect intr-o clasa sunt conventionale; totu§i, foarte multe "conventii” au 
intrat in viata de zi cu zi astfel incat de cele mai multe ori putem realiza clasificari fara a 
cunoa§te exact valorile numerice ale parametrilor implicati. Clasificarile pomenite au apelat 
la cate o singura proprietate, sexul, respectiv varsta. 
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Este cazul sa facem doua observatii: 

- prima: din larga paleta de caracetristici, o buna parte nu au putere de 
discriminare, avand valori variind pe plaje similare pentru toate clasele (de ex: glicemia nu 
are putere de discriminare pentru stabilirea sexului sau a varstei; ea devine insa o 
proprietate importanta la defmirea clasei diabeticilor). 

- a doua observatie: indivizii din clase diferite se deosebesc prin mai multe 
caracteristici (de ex: valorile "normale" la femei sunt diferite de cele la barbati pentru destul 
de multi parametri; la fel, putem urmari variatia unor valori ’’normale” cu varsta); totu§i 
pentru defmirea unei clase nu apelam la toate deosebirile, multumindu-ne cu un numar 
redus de parametri, destul de des chiar cu unul singur, cum au fost clasificarile date ca 
exemplu pane acum. 



Exista insa situatii in care clasele nu pot fi definite dupa un singur parametru; de 
exemplu putem imparti indivizii in: ”obezi", ’’normali” §i ”ca§ectici”. Observam imediat ca 
greutatea nu este un parametru suficient; un individ cu greutatea de 75 kg pare obez la 
inaltimea de 1,55 §i slab la 1,95. Trebuie deci sa definim clasele luand in considerare §i 
inaltimea. in asemenea situatii se obi§nuie§te sa se faca reprezentari intr-un sistem de 
coordonate avand pe axe cei doi parametri numit spatiul starilor. Intr-un astfel de spatiu un 
individ este reprezentat printr-un punct. (fig.IV.2.) 

Aprecierea apartenetei la o clase sau alta se poate face pe diferite criterii. in 
exemplul acesta apartenenta la o clasa dupa aspectul fizic conduce la o clasificare cu 
sensibilitate §i specificitate destul de buna, de§i din punct de vedere medical este 
considerate nesatisfacatoare. Cand criteriul de clasificare nu utilizeaza pentru defmirea 
claselor valorile parametrilor folositi, spunem ca avem un clasificator independent; daca 
depinde exclusv de parametrii utilizati atunci avem un clasificator formal, iar daca 
folose§te numai unii din parametrii de reprezentare, eventual impreuna cu alti parametri 
(adesea calificativi), atunci il numim clasificator partial dependent. 

in cazul clasificatorilor formali impartirea in clase este definite prin relatii, cel mai 
adesea empirice, limitele dintre clase fund conventionale §i deci oferind subiect de dispute. 
Este §i cazul exemplului dat in care domeniul greutetilor acceptabile se defme§te in functie 
de greutatea normale (sau ideaie), care este date de o relatie de genul (IV.2): 

m t = (h-100) - (h-159)/4, [h in cm, m in kg] (IV.2) 

in jurul acestei drepte, intr-un interval cu letimea de 15% se considera greuteti acceptabile, 
cei cu greuteti mai mari decat 1,15 m t fiind numiti supraponderali , iar dace depe§esc 
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greutatea ideala cu peste 20% sunt numiti obezi\ similar se definesc clasele de 
subponderali , respectiv cagectici. 



Figura IV. 3. Caracterizarea undelor EEG intr-un spatiu bidimensional: frecventa - 
amplitudine. Sunt ilustrate zonele undelor tipice a (o.i. = ochii inchi§i, od = ochii deschi§i), 

(3, a, 8 , complexele varf-unda din descarcari epileptice (ep.) §i undele din faza de somn 
"Rapid-Eye-Movement" (REM) 

Cele mai interesante reprezentari apar in cazul clasificatorilor independent! sau 
partial dependenti, situatii in care delimitarea dintre clase nu mai este bine deifmta §i in 
practica putem intalni §i zone de intersectie (multimile nu sunt disjuncte). In fig. III.3 am 
reprezentat undele EEG tipice in spatiul amplitudine-frecventa cu un clasificator partial 
dependent. Ne putem imagina §i o reprezentare cu un clasificator independent, de exemplu 
luand 3 loturi: un lot de sportivi, unul de indivizi sanato§i nesportivi §i un lot de astmatici §i 
sa-i reprezentam intr-un sistem de coordonate, sa zicem capacitate vitala - VEMS (volum 
expirator maxim pe secunda). Clasele se vor suprapune partial insa pentru fiecare grup va 
exista zona sa de dominanta. in metoda ’'pattern-recognition” aplicata diagnosticului asistat 
clasificatorul este cel mai adesea partial dependent sau independent, multi dintre parametrii 
utilizati fund calitativi, deci fara posibilitatea de a fi plasati pe axe. 

Problema principals care se pune este ca, avand la dispozitie ansamblul de date, 
cantitative §i calitative atat pentru loturi de pacienti grupati pe diagnostice cat §i pentru 
loturi de control (normali), sa gasim cel mai potrivit sistem de axe de coordonate care ne 
permite sa reprezentam loturile prin regiuni cat mai compacte §i, daca este posbil, ca 
acestea sa fie disjuncte; aceasta faza se nume§te "selectia atributelor”. Dupa ce s-au gasit 
parametrii potriviti se calculeaza domeniile lor de variatie pentru fiecare clasa, definindu-se 
regiunile din spatiu ale claselor, etapa numita "invatare supervizata". in aceasta faza 
calculatorul este aproape gata sa stabileasca diagnosticul unui pacient reprezentandu-1 in 
spatiu §i gasind in ce domeniu, din cele definite anterior, se gase§te. Un ultim aspect care ar 
mai trebui rezolvat se refera la criteriul dupa care luam decizia de aparteneta la o clasa, deci 
mai este necesara etapa de definire a unei fimctii de decizie. Toate aceste etape au un suport 
matematic solid §i au fost prezentate sumar in capitolul de prelucrare a semnalelor 
biologice. Acum nu ne oprim in detaliu la aceste aspecte, trecand doar rapid in revista 
elementele esentiale ale fiecarei etape. 
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4.2. Etapele aplicarii metodei “pattern recognition”. 
Clasificarea metodelor 

a) Alegerea atributelor ("feature selection") 

Cel mai important aspect in recunoa§terea unui pattern insa §i cel mai mult 
discutat este cel referitor la alegerea atributelor cu putere reala de descriminare a 
claselor. Din imensitatea de marimi caracteristice ale unui obiect sau individ (R), 
retinerea celor mai "importante" caracteristici poate fi legata de indeplinirea unor 
conditii pentru fiecare atribut selectat: 

- sa aibe o variabilitate mica in interiorul claselor (minimizarea "distantelor" 
intraclasa) 

- sa ofere o discriminare satisfacatoare intre clase (maximizarea "distantelor” 
interclase). 

S-au propus o serie de metode pentru optimizarea selectarii aributelor, bazate pe 
transformari de coordonate, fie rotatii, fie introducerea unor ponderi. Se incearca §i gasirea 
unor noi variabile prin "combinarea" caracteristicilor initiate, insa numarul acestor 
combinatii este tot foarte mare. Rezultatele care se obtin sunt satisfacatoare pentru aplicarea 
practica, matematicienii fiind mai curand nemultumiti nu de rezultate ci de absenta unui 
criteriu nediscutabil de optimizare. Trebuie sa mai mentionam ca, dupa depistarea 
caracteristicilor eligibile, se verifica §i gradul de corelatie intre ele; in cazul unor corelatii 
putemice intre doua caracteristici se pastreaza numai una, informatiile aduse de cealalta 
fiind redondante. Se ajunge in final la selectarea unui numar deosebit de scazut de atribute 
(N«R) care pastreaza (uneori chiar imbunatatesc) capacitatea de discriminare intre clase. 

b) tnvatarea supervizata. Definirea criteriului de clasificare 

in faza de alegere a atributelor am ajuns la precizarea in spatiul cu N dimensiuni a 
pozitiei fiecareia din cele K clase; spunem ca am realizat o "invatare" supervizata - la fel 
cum fiecare persoana de fapt trebuie intai sa invete pentru a putea apoi realiza o 
recunoa§tere. Sa presupunem ca impartirea in clase a fost realizata conform graficului din 
fig.IV.2, separarea intre clasele notate O, N §i S fiind data de liniile de 15%. Introducand 
acum datele unui individ despre care nu §tim in ce clasa face parte, el va apartine unei 
regiuni deci poate u§or fi inclus intr-o clasa §i - important - putem face clasificarea chiar 
fara a mai efectua celelalte calcule. Principii similare stau la baza constructiei 
nomogramelor daca numarul de variabile este scazut. Trebuie mentionat totu§i ca acest gen 
de clasificare este posibil numai daca ansamblul claselor umplu intregul spatiu, deci cand 
separarea intre clase se face prin plane (sau suprafete curbe) in spatiul cu N dimensiuni 
(hiperplane). 

Exista cazuri in care regiunea unei clase nu este definita printr-o relatie ce ne 
permite extinderea sa, ea fiind restransa la spatiul delimitat de valorile din setul de invatare 
(ca de ex. in fig.IV.3); astfel de situatii apar mai ales cand criteriul de clasificare este extern 
- independent sau partial dependent. In aceste situatii este posibil sa intalnim obiecte 
(indivizi) care nu apartin nici unei clase intalnite anterior, incadrarea sa intr-o clasa se poate 
face in fimctie de "apropierea" de una din clase, deci trebuie sa alegem un criteriu 
geometric §i sa masuram distanta de la obiectul nostru pana la clasele definite (s-au propus 
variante de distante: pana la "centrul" clasei sau pana la suprafata clasei). 

in masurarea distantelor intr-un spatiu multidimensional apare o problema 
deosebita: marimile de pe axe au - aproape intotdeauna - unitati de masura diferite, fiind 
deci incomparabile! O solutie este "normalizarea" lor obtinuta cel mai adesea prin 
transformarea tuturor marimilor in procente: se alege pentru fiecare marime o referinta (fie 
valoarea maxima, fie cea medie, fie derivatia standard etc.) §i se transforma toate datele in 
procente fata de referinta. Aceasta operatiune se face de fapt inainte de selectia atributelor, 
fiind utila §i in faza respectiva. 

Deci intr-un spatiu normalizat putem compara distantele §i vom putea stabili un 
criteriu dupa care sa clasificam orice obiect cand sunt cunoscute caracteristicile claselor. 
Reguli de acest gen se pot aplica §i in cazul claselor definite prin clasificatori formali. 
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c) invatare nesupervizata. Metoda gruparii 

Sistemul descris anterior, de invatare supervizata, presupune o cunoa§tere apriori 
a claselor, deci in faza de invatare se introduc in calculator, pe langa toate marimile culese 
despre obiect, §i informatii privind clasa careia ii apartine. in aceste situatii calculatorul este 
folosit numai pentru a categorisi obiecte introduse ulterior in calculator in aceste clase. 

Avem insa posibilitatea de a urmari modul in care sunt distribute punctele, care 
reprezinta obiectele (indivizii), intr-un spatiu multidimensional fara a defini de la inceput 
nici un fel de clase. In cazul in care gasim regiuni de concentrare a punctelor (’’clusters”), 
putem defini clase in jurul lor. Spunem in acest caz ca avem o invatare nesupervizata, 
clasele nefiind definite apriori ci fund "descoperite" de calculator. 

Metoda ’’pattern recognition”, de§i are unele calitati prin care depa§e§te substantial 
alte metode de diagnostic asistat, nu are o raspandire prea larga datorata numarului mare de 
parametri ce trebuie cule§i in faza initiala precum §i numarului foarte mare de calcule 
necesar pentru optimizari §i decizii, ceea ce a impus de la inceput utilizarea unor 
calculatoare performante, accesibile doar in centrele mai importante de cercetare. Se poate 
remarca totu§i o cre^tere a numarului de aplicatii in ultimul timp, in ciuda concurentei 
puternice a metodei ce o vom descrie in continuare - sitemele expert. 


5. ELEMENTE DE LOGICA 

Metodele expuse pana acum, cu performante mai ridicate sau mai modeste, sufera 
toate de un neajuns: utilizeaza un format de exprimare diferit de cel curent al medicilor. In 
practica uzuala informatia se transmite prin propozitii, iar rationamentul medical se 
construie§te prin operatii cu aceste propozitii. Pare deci cat se poate de natural ca cele mai 
agreate metode de diagnostic asistat s-au dovedit cele pe care le numim "euristice" (1. gr. 
heuriskein - a descoperi) in care pozitia centrala o ocupa sistemele expert. In aceste metode 
atat baza de cuno§tinte cat §i vectorul de stare al pacientului se exprima prin propozitii, cu 
care se efectueaza operatii logice. Vom prezenta in continuare sintetic cateva notiuni 
fmdamentale de logica. 

5 . 1 . Notiuni generale 

a) Propozitia 

in viata curenta ideile noastre se transmit prin propozitii ce exprima proprietatile 
unor obiecte, cauzele unor evenimente, sau exprima intrebari, dorinte, porunci etc. Putem 
deci clasifica propozitiile in cel putin 3 clase mari: 

> propozitii cognitive = insu§iri ale obiectelor, cauzele unor evenimente 

> propozitii interogative = intrebari 

> propozitii imperative = ordine, dorinte. 

Ex. Asmul bron§ic este o boala a aparatului respirator este o propozitie cognitiva.. 

Numai propozitiile cognitive au asociata o valoare de adevar, adica o propozitie 

poate fi: 

■ adevarata (A sau 1) 

■ falsa (F sau 0) 

■ nesigura (?). 

b) Forma logica 

Exprimarea ideilor se realizeaza in cadrul unor scheme, cu diferite grade de 
complexitate pe care le numim forme logice . Am intalnit deja o forma logica: propozitia. O 
propozitie este de fapt aplicarea unei operatii logice (de ex. afirmatia) asupra unor forme 
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logice mai simple, numite notiuni. in exemplul de mai sus am utilizat doua notiuni: cismul 
bron§ic, respectiv boala a aparatului respirator. Prima (asmul bron§ic) reprezinta obiectul 
gandirii §i in propozitie se va numi subject logic , notat cu S iar a doua notiune (boala a 
aparatului respirator) reda “ce se spune despre subject” §i se va numi predicat logic, notat 
cu P. Operatia care leaga aici S §i P este afirmativa §i putem nota formula generala a unei 
propozitii afirmative: 

S este P 

Pentru o propozitie negativa formula generala este: 

S nu este P 

Ex. Astmul bron§ic nu este boala infectioasa 

Pe langa formele logice simple mentionate deja - notiunea §i propozitia - exista §i 
o forma logica mai complexa, inferenta, care cuprinde mai multe propozitii; unele numite 
premise din care construim o propozitie derivata numita concluzie. Ex.: 

Premise: - Hemoragia duce la scaderea masei eritrocitare 

- Eritrocitele contin hemoglobina 

Concluzie: - Hemoragia duce la scaderea hemoglobinei (anemie) 

Observam deci ca formele logice pot fi ierarhizate: notiunea, propozitia, inferenta. 

c) Propozitii categorice 

Propozitiile categorice sunt cele mai simple propozitii logice, exprimand un singur 
raport intre doua notiuni, fara nici o conditie. Ele pot fi: 

- universale: 

= afirmative: Toti S sunt P 

= negative: Nici un S nu este P 

- particular: 

= afirmative: Unii S sunt P 

= negative: Unii S nu sunt P 

- singulare: 

= afirmative: Acest S este P 

= negative: Acest S nu este P (IV.3) 

in logica propozitiile singulare sunt testate ca universale, S fiind o clasa cu un 
singur element. 

d) Pricipiile logicii 

Aplicarea unor operatii asupra formelor logice pentru a obtine propozitii noi 
trebuie sa respecte o serie de legi de rationare, dintre care patru au un caracter fundamental 
§i se numesc principii logice . 

■ Principiul identitatii: un obiect este inconfundabil cu alt obiect. 

■ Principiul non-contradictiei: o propozitie nu poate fi §i adevarata §i falsa in acela§i 
timp. 
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■ Principiul tertului exclus: o propozitie - intr-un context - poate fi fie acceptata, fie 
neacceptata; nu trebuie confundat cu principiul bivalentei privind valoarea de 
adevar a propozitiei (sta la baza demonstrate prin reducere la absurd). 

■ Principiul ratiunii suficiente : nici o propozitie nu este acceptata sau respinsa intr- 
un rationament decat daca exista o justificare pentru acceptare (respingere, 
necesitate §i suficienta). 


5 . 2 . Propozitii compuse 

Prin aplicarea unor operatii logice asupra unor propozitii simple se obtine o forma 
logica noua - propozitia compusa. Valoarea de adevar a propozitiei compuse este 
dependents de valoarea de adevar ale propozitiilor simple §i este redata uzual sub forma 
unor M tabele de adevar”, in care se noteaza valoarea ’’adevarat” cu 1 §i "fals" cu 0. 
Prezentam in continuare operatiile logice posibile pentru constructia unor propozitii 
compuse, impreuna cu tabele de adevar asociate. 


a) Negatia : notata ’ ~ 4 sau 4 1 este un operator 4 unar’ ~ p se cite§te 'non-p'; se mai 
nume§te ’NOT’ 


q 

i 

0 

~p 

0 

i 


b) Conjunctia : notata ’A' sau este un operator binar; p & q se cite§te ’p §i q’; se mai 
nume§te ’AND’ 



1 

0 

i 

1 1 

0 

0 

0 

0 


c) Disjunctia : notata ’V’; pVq se cite§te ’p sau q’; se mai nume§te ’OR’ 



1 

0 

1 

1 

1 

0 

1 

0 


d) Disjunctia exclusiva : notata ’ ® ’ sau ’W’; pWq sw cite§te ’sau p, sau q’; se mai nume§te 
'XOR' 



e) Implicatia: notata ’ — > p — > q se cite§te ’daca p atunci q’; p se nume§te antecedent, q se 

nume§te consecvent 
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1 

0 

1 

1 

1 

0 

0 

1 


f) Echivalenta : notata ’ ^ ' sau ' = p = q se cite§te ’ daca §i numai daca p atunci q' 



1 

0 

1 

1 

0 

0 

0 

1 


5 . 3 . Inference logice 

O forma logica mai complexa decat propozitia este inferenta, prin care, din unele 
propozitii (premise) se construie§te o propozitie noua (concluzie). 

Exista doua clase mari de inference: 

- deductive - de la general spre particular 

- inductive - de la particular spre general. 

Sistemele expert actuale utilizate in domeniul medical utilizeaza exclusiv 
inference deductive. Vom prezenta in continuare prtincipalele operatii cu propozitii 
compuse. Vom nota inferenta cu semnul ’ i ’ , plasand premisele in stanga §i concluzia in 
dreapta. i 


a) Modus ponens: 

p^q 

p 

b) Modus tollens: 

p^q 

b~p 
~ q 


c) Silogismul: 


p^q 

r p^ r 

q -^r 

Ar putea fi desigur analizate detaliat cazurile ce apar in functie de tipul fiecarei 
propozitii p, q, r, insa nu ne-am propus prezentarea acestor detalii, scopul principal fund 
reamintirea elementelor fundamentale de logica ce stau la baza constructiei unora dintre 
cele mai performante programe de informatica medicala: sistemele expert. 
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5.4. Elemente ale limbajului PROLOG 

Majoritatea limbajelor de calculator sunt orientate pentru rezolvarea unor 
probleme numerice, avand ca operatori fundamentali operative aritmetice. Lucrul cu 
propozitii necesita insa un limbaj adecvat, in care operatorii fundamentali sa fie operatorii 
logici M nu, §i, sau”. Un astfel de limbaj este ’PROLOG’ (PROgramming in LOGics), dedicat 
pentru transpunerea formala a propozitiilor §i operatii cu propozitii. Rularea unui program 
implica estimarea valorii de adevar a fiecarei propozitii, iar rezultatul este intotdeauna fie o 
valoare de adevar, fie o propozitie. 

Elementul fundamentale ale limbajului PROLOG sunt: 

- predicate: care exprima o relatie intre obiecte, de obicei primul avand rolul 
subiectului dintr-o propozitie logica iar al doilea, eventual §i celelalte fiind obiect al 
actiunii sau proprietati 

- clauze: reprezinta fapte sau reguli; ele se construiesc folosind predicatele enumerate 
in sectiunea de predicate avand inlocuite concret valori pentru parametrii de 
paranteza 

domenii: reprezinta paragraful de inceput al unui program in PROLOG in care sunt 
enumerate tipurile de variabile / parametri intalniti in clauze. 

Exemplu: 

domains 

diagn = symbol 

tens_art_sis = integer 

hemoglobin = real 

predicates 

are (pacient, diagn, tens_art_sis, hemoglobin) 
clauses 

are (X, anemie, _ , Y) if Y < 1 1 .5 

are (X, hipertensiune, Z, _) if Z >150 

are (X, sanatos, T,Y) if Z <= 150 and Y >= 11.5) 

are (popescu, Diag, 12, 140) 

are (ionescu, Diag, 11, 135) 

are (petrescu, Diag, 13, 160) 

are (vasile, Diag, 10, 155). 

Observam ca in clauze apar doua feluri de propozitii: primele trei reprezinta 
reguli , (continand variabile) iar urmatoarele 4 sunt fapte, continand date. 

Programul solicita operatorului rezolvarea unei probleme (’goal’); de ex. pentru un 
caz particular: 

goal: 

are (ionescu, Diagn, 11, 135) 
vom primi raspunsul: 

Diagn = anemie 
iar pentru un caz general: 
goal: 

are (X, Diagn, _ , _) 
vom primi raspunsul: 

X = popescu, diagn, = sanatos 
X = ionescu, diagn = anemie 
X = petrescu, diagn = hipertensiune 
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X = vasile, diagn = anemie 
X = vasile, diagn = hipertensiune 
5 solutions. 

Desigur in situatii reale avem un grad mult mai ridicat de complexitate. 
Exemplele prezentate sunt foarte simple, insa ilustreaza modul in care se formalizeaza 
informatiile in cadrul sistemelor expert. 


6. SISTEME EXPERT 

6.1. Structura unui sistem expert 

in figura IV.4 este prezentata schematic structura unui sistem expert. 



Figura IV.4. Structura unui sistem expert 


Sa descriem pe scurt sistemele componente. 

a) B.CUN - baza de cuno§tinte: este elementul fundamental al unui sistem expert 
in care cuno§tintele sunt de obicei clasificate pe trei nivele: 

- nivelul cuno§tintelor factuale, care cuprinde fapte reprezentate ca instante ale 
conceptelor (cuno§tinte empirice) 

- nivelul cuno§tintelor conceptual, care cuprinde cuno§tinte teoretice, reliefand 
legaturile §i relatiile cauzale intre elemente 

- nivelul de metacunoa§tere, care cuprinde cuno§tintele despre cunoa§tere §i 
reprezentarile sale. 

Metodele de realizare a bazelor de cuno§tinte constituie un dezvoltat capitol al 
inteligentei artificiale numit ’’ingineria cunoa§terii" (knowledge engineering) sau 
’’reprezentarea cuno§tintelor M (knowledge representation). Cele mai utilizate metode de 
reprezentare a cunoa§terii sunt: 

- reprezentarea prin formalizare in calculul predicatelor 

- metode procedurale 

- retele semantice 

- sisteme de productie (’’production rules”) 


194 










D. Lungeanu, Gh.-I. Mihala§ 


- reprezentare prin cadre 

- reprezentare cu hiper-retele. 

Nu ne oprim aici pentru descrierea lor; mentionam doar ca van Bemmel semnala 
inca in 1985 ca formalizarea cuno§tintelor medicale, care are deocamdata un nivel deosebit 
de scazut, necesita o pregatire teoretica adecvata, insistand asupra introducerii 
biomatematicii in programa facultatilor de medicina. 

b) S.COG. - sistemul cognitiv: asigura accesul la baza de cuno§tinte §i are in 
principal doua sarcini: 

- cautarea pieselor de cunoa§tere in baza de cuno^tinte (fie prin simboluri fie prin 
proprietati) 

- crearea §i actualizarea bazei de cuno§tinte (prin adaugiri, §tergeri sau 
modificari). 

c) S.REZ. - sistemul rezolutiv (l.engl: inference machine) este modulul central 
din program ce are ca obiectiv rezolvarea problemelor puse de utilizator; in functie de 
gradul de complexitate el poate realiza: 

- alegerea strategiei de control adecvate problemei 

- elaborarea planului de rezolvare 

- desfa§urarea actiunilor din plan 

- trasarea drumurilor de rationament prin arborii deductivi 

- constituirea informatiei de control 

- verificarea pa§ilor de rezolvare. 

Performantele unui sistem expert sunt determinate in principal de calitatea 
sistemului rezolutiv. Actualmente sunt realizate sisteme expert acoperind o gama larga de 
performance, de la sisteme simple, in care sistemul rezolutiv se limiteaza la cererea pieselor 
de cunoa§tere §i estimarea unor M potriviri M intre situatia reala §i diferite piese de cunoa§tere, 
pana la sisteme sofisticate, cu elaborare de strategii §i capabile sa schimbe strategia de 
rezolvare daca este cazul. 

d) S.EXP. - sistemul explicativ: are ca sarcina principals justificarea solutiilor 
oferite de sistemul expert la problemele puse, prin: 

- listarea §i/sau interpretarea drumurilor de rationament ale sistemului rezolutiv 

- editarea cauzelor gre§elilor sau e§ecului in gasirea unei solutii 

- evidentierea pieselor de cunoa§tere care lipsesc din lantul inferential. 

Sistemul explicativ poate chiar lipsi sau poate fi foarte simplu (enumerarea 

pieselor de cunoa§tere folosite), dar poate fi elaborat pana la justificarea fiecarui pas din 
rationament sau evidentierea unor piese de cunoa§tere contradictorii sau suspecte. Sistemul 
explicativ are un rol deosebit de important in utilizarea sistemelor expert in procesul 
didactic. 

e) S.COM. - sistemul de comunicare: asigura interfata cu utilizatorul; de§i 
dialogul este dirijat de sistemul rezolutiv, sistemele de comunicare evoluate pot contine: 

- procesoare pentru limbaje de reprezentare a cunoa§terii 

- procesoare pentru achizitia semnalelor sau imaginilor, ie§iri grafice, conexiuni 
cu alte echipamente etc. 

f) S.MET. - sistemul metarezolutiv: este inclus in schemele clasice ale sistemelor 
expert de§i sistemele realizate pana in prezent inca nu il contin. Sarcina acestui sistem ar fi 
adecvarea §i validarea mecanismelor fundamentale utilizate de sistemul rezolutiv (sau 
cognitiv), evaluarea caracteristicilor domeniului de expertiza, preluand sarcini dirijate ale 
sistemului rezolutiv privind prioritati §i restrictii de aplicare ale strategiilor de rezolvare. 

Sistemele expert medicale realizate §i aplicate pana in prezent, de§i au diferite 
nivele de dezvoltare, au cautat in special dezvoltarea bazelor de cuno§tinte avand sistemul 
rezolutiv §i cel explicativ la nivele relativ modeste comparativ cu nivelul teoretic in 
domeniu §i acesta s-ar datora intr-o buna masura nivelului inca nesatisfacator al 
formalizarii cuno§tintelor medicale. Aceasta este §i directia in care se depun actualmente 
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cele mai mari eforturi, fund necesara in paralel §i o pregatire corespunzatoare a potentialilor 
utilizatori. 

6.2. Descrierea conexiunilor 

Vom incerca sa descriem intr-o forma simplificata aspectele functionale 
fundamentale ale unui sistem expert prin descriere a conexiunilor intre subsisteme. 

Utilizatorul U formuleaza problema (intrebarea) notata in fig. 3 prin conexiunea P. 
Sistemul de comunicatie care asigura interfata cu ansamblul de prelucrare a cunoa§terii 
despre domeniu transforma problema P a utilizatorului in ’’problema bine defmita” - 1, care 
este transmisa sistemului rezolutiv. Acesta alege o strategic, elaboreaza un plan de 
rezolvare §i, pentru realizarea acestui plan solicita piese de cunoa§tere de la sistemul 
cognitiv (conexiunea 2), care o solicita bazei de cuno§tinte (conexiunea 2’); piesa de 
cunoa§tere este transferata sistemului rezolutiv (conexiunile 3 §i 3’). Ciclul 2-2'-3-3' se 
repeta de cate ori este necesar pana cand sistemul rezolutiv fie gase§te solutia (sau solutiile) 
problemei, fie abandoneaza cautarea solutiei din diferite motive, ce vor fi comunicate 
utilizatorului. Rezultatul obtinut este transmis prin conexiunea 4 catre sistemul explicativ 
care transforma in forma inteligibila mesajele sistemului rezolutiv, transmitandu-le prin 
sistemul de comunicatie (conexiunea 5) catre utilizator, sub forma raspunsului R. Dupa 
comunicarea raspunsului, utilizatorul poate investiga mai in detaliu modul de rezolvare 
obtinand - la cerere - intregul traseu al rationamentelor; se pot astfel evidentia cauzele 
abandonului, piesele de cunoa§tere lipsa sau contradictorii, date insuficiente in problema 
etc. 

Este evident ca actualizarea bazei de cuno§tinte este strict necesara pentru 
obtinerea unor rezultate de incredere. Pentru aceasta operatie utilizatorul poate analiza 
oricand piesele de cunoa§tere, direct prin conexiunile 2” §i 2’, fara sa fie necesara o 
problema pentru a fi solicitate. Introducerea unor noi piese de cunoa§tere se face tot direct, 
prin conexiunile 6 §i 6’. 

Adaugarea unui sistem metarezolutiv ar permite supravegherea unor actiuni in 
cursul functionary sistemului expert prin conexiunile 7, 7’ §i 7” de adecvare a 
mecanismelor fundamentale. Sistemul metarezolutiv ar folosi cuno^tintele la nivelul 
metcunoa§terii din baza de cuno§tinte prin conexiunea 8. 

6.3. Caracteristicile principale ale sistemelor expert 

Dupa ce peste doua decenii progresele inregistrate in domeniul diagnosticului 
asistat au fost relativ modeste, aparitia sistemelor expert a revigorat sperantele in aceasta 
directie. Ce au sistemele expert deosebit fata de celelalte modele? 

a) Sistemele expert au trecut de la reprezentarea empirica a cuno^tintelor la 
reprezentari adecvate pentru complexitatea lor, fiind clasificate pe nivele §i cuprinzand §i 
relatiile. 

b) Rationamentele folosite de sistemele expert se fac prin mecanisme inferentiale, 
depa§ind simplele structuri liniare, folosind mecanisme de cautare adecvate ce permit 
cre§terea deosebita a performantelor. 

c) Sistemele expert pot extrage cuno§tinte din baze de date. 

d) Sistemele expert se incadreaza in clasa programelor de inteligenta artificiala 
prin caracteristica lor de a putea invata. 

lata ca exemplu o secventa din rularea unui program. Din meniul principal se 
alege modul de lucru: ’’introducerea simptomelor”; o portiune de dialog este prezentata mai 
jos: 
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> dureri? 

: da 

> localizare 
: piept 

> se agraveaza la efort? 

: da 

> palpitatii? 

: da 

> hipertrofie ventriculara? 
: da 

> stanga/dreapta? 

: stanga 


Dupa introducerea simptomelor se revine in meniul principal §i se alege modul de 
lucru: '’diagnostic”; ilustram din nou o secventa: 

» diagnostic propus: hipertensiune 
» sunteti de acord cu diagnosticul propus? (da/nu) 

: nu 

» care este diagnosticul dvs.? 

: angina pectorala 

in aceasta faza programul cauta in baza de cuno§tinte "angina pectorala” §i 
simptomele sale, facand comparatie cu simptomele introduse. Daca "angina pectorala” 
exista in baza de cuno§tinte calculatorul va evidentia - din filmul rularii executate - 
intrebarea la care decizia sa a ales alta ramura, precizand: 

» nu am ales: angina pectorala 
» deoarece la intrebarea: "transpiratie rece?” 

» ati raspuns: "nu” 


Daca in baza de cuno§tinte nu figureaza "angina pectorala”, dialogul ar contiua astfel: 

» piesa de cunoa§tere absenta in baza de cuno§tinte: angina pectorala 

> prin ce se deosebe§te : angina pectorala 

> de: hipertensiune 

> proprietate noua #1 : 

: dispnee 

> proprietate noua #2: 

: end 

> doriti sa salvam noul diagnostic? 

: da 


Am introdus astfel o noua piesa de cunoa§tere care mo§tene§te proprietatile de la 
precedenta §i in plus are o proprietate in plus, inexistenta la precedenta. Noua piesa 
impreuna cu proprietatile sale va fi introdusa in baza de cuno^tinte. La o noua rulare a 
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programului, raspunzand in acela§i mod ca in rularea precedents, dialogul se va desfa§ura 
la fel pana cand se propunea un diagnostic, insa acum va mai apare o intrebare: 

> dispnee? 

: da 

» diagnostic propus: angina pectorala 

in exemplul dat am folosit o parte din baza de cuno§tinte a sistemului expert 
INTERNIST insa, la fel ca multe alte sisteme expert, pentru cre§terea operativitatii in 
manevrare, simptomele nu se introduc prin dialog ci prin selectie dintr-o lista de mari 
dimensiuni (de ex. pentru versiunea INTERNIST folosita de noi aceasta lista de simptome 
se intinde pe 34 pagini-ecran). 

Exemplul dat este simplificat fata de programul real, care prezinta de fapt o lista 
de diagnostice ierarhizate dupa procentul de potriviri. De asemenea se iau masuri §i pentru 
asigurarea ca baza de cuno§inte nu va fi modificata de persoane neautorizate. De obicei un 
sistem exepert de uz practic are un administrator care raspunde de integritatea bazei de 
cuno§tinte. 

6.4. Sisteme expert medicale 

Primul sistem expert, DENDRAL, a fost realizat in 1964 §i se referea la structurile 
moleculelor organice. in domeniul medical primul sistem expert, de mare succes, a fost 
MYCIN realizat de colectivul condus de Shortliffe pentru diagnostic in infectii bacteriene 
ale sangelui, bazat pe simptome §i date de laborator; dupa estimarea diagnosticului sistemul 
facea §i propuneri de tratament medicamentos. Conceptii similare au stat §i la baza altor 
doua sisteme expert: HEADMED pentru patologia neuro-psihiatrica §i PUFF pentru boli 
pulmonare. Cel mai cunoscut sistem expert este INTERNIST, pentru asistarea 
diagnosticului in medicina interna; sistemul este intens folosit §i in scopuri didactice in 
multe universitati din lume. Un alt sistem, expert intr-un domeniu mai ingust, insa de mare 
utilitate practica este VM (Ventilator Monitor); acesta este capabil sa supravegheze 
functionarea plamanului artificial in saloanele de terapie intensiva, sa ia decizii in foarte 
multe situatii §i sa avertizeze, eventual, personalul in situatii delicate. Sistemul expert 
CASNET, pentru diagnostic in boli de ochi este unul dintre sistemele expert cele mai bine 
elaborate prin organizarea bazei de cuno§tinte. Din punct de vedere al aplicatiilor directe 
probabil ca cel mai utilizat este sistemul TROPICAID, elaborat pentru asistarea 
diagnosticului in tari tropicale, ce permite rezolvarea a peste trei sferturi din cazuri de catre 
un cadru mediu, selectand astfel pentru asistenta medicala mai elaborate numai cazurile 
mai deosebite. in ultimul timp au aparut sisteme expert "independente de domeniu”, numite 
§i ’’shell” (de exemplu INTEXP) adica sisteme expert cu structura flexibila in care 
utilizatorul i§i poate introduce baza proprie de cuno§tinte, obtinand astfel un sistem expert 
specializat. 

De§i eforturile depuse pentru realizarea sistemelor expert au fost foarte mari iar 
unele sisteme au ajuns destul de performante, aplicarea lor concreta este inca relativ 
limitata, dar in cre§tere constants, odata cu cre§terea dotarii cu tehnica de calcul §i cre§terea 
nivelului de pregatire al utilizatorilor. Sistemele expert vor constitui probabil un instrument 
omniprezent in clinici §i cabinete medicale, chiar daca vor fi folosite numai pentru 
"asistarea” medicului in faza de diagnostic. 
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1 . ESTIMAREA CALITATII CLASIFICARII 

Sistemele de diagnostic asistat realizeaza, principial, o operatie de clasificare. 
Utilizarea calculatoarelor pentru asistarea in aceste operatiuni nu este lipsita de riscul unor 
clasificari gre§ite. De aceea, este important a avea criterii bine definite de apreciere a 
calitatii unui clasificator. (Mentionam aici ca aceste criterii au un caracter general, nefiind 
restranse ca aplicabilitate numai la diagnosticul asistat). 

Aprecierea porne§te desigur de la confruntarea cu realitatea (Tabel IV.4.). Sa 
consideram ca dintr-un total de N indivizi, L, sunt pozitivi (de exemplu au o boala) §i 
notam cu L 2 restul indivizilor, care sunt negativi din punct de vedere al afectiunii respective 
(atentie: nu impunem alte conditii, deci nu inseamna ca L 2 sunt sanato§i - ei pot avea alte 
afectiuni). Clasificatorul pe care dorim sa-1 analizam - in cazul nostru va fi un algoritm de 
clasificare - face o clasificare corecta a n n indivizi dintre cei Li; ace§tia se vor numi 'real 
pozitivi' (R+). Restul subiectilor, pana la L b (adica n 12 ), au fost apreciati ca neapartinand 
clasei K - se vor numi in acest caz fals negativi' (F-). Dintre cei L 2 care sunt negativi, un 
numar n 22 au fost clasificati corect, ca neapartinand clasei K (real negativi R - ), dar n 21 au 
fost clasificati gre§it, ca apartinand clasei K - ace§tia sunt 'fals pozitivi' (F +). 


Tabel IV.4. Estimarea calitatii clasificatorului 



clasificator 

K+ K- 


B 

real 

nu 

n l2 

u 

B- 

n 21 

n 22 

u 


Ci 

c 2 

N 


Se folosesc uzual trei perechi de indicatori pentru a estima calitatea clasificarii. 

a) Perechea sensibilitate (SN) - specificitate (SP) 

Sensibilitatea reprezinta capacitatea clasificatorului de incadrare corecta a 
celor pozitivi, iar specificitatea este capacitatea de rejectie corecta a celor negativi: 

SN = p(K+/B+) = n 11 /L 1 

SP = p(K-/B-) = n 22 / L 2 

b) Valoarea predictiva pozitiva (VPP) §i valoarea predictiva negativa (VPN) 

Valoarea predictiva pozitiva (VPP) este definita prin proportia incadrarii 
corecte a celor declarati pozitivi iar valoarea predictiva negativa (VPN) prin rata 
incadrarii corecte a celor clasificati negativi: 

VPP = p(B+/K+) = n 11 /C 1 

VPN = p(B-/K-) = n 22 / C 2 

c) Indicatori globali - acuratetea §i rata erorii de clasificare 

AC = ( n^i + n 22 ) / N 


RE = ( n i2 + n 2i ) / N 
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Curba ROC 

Clasificarea se face functie de o valoare de prag, care poate fi un parametru 
complex determinat de algoritmul analizat. Indicatorii de estimare a calitatii au valori 
dependente de aceasta valoare de prag: o valoare mai scazuta decat media va fi mai 
„ingaduitoare”, acceptand mai lejer includerea unui subiect in clasa K+, caz in care se 
produce o cre§tere a sensibilitatii, reducandu-se numarul de fals negativi. Din pacate, in 
acela§i timp o parte din n 2 2 tree in n 2 i, crescand numarul de fals pozitivi §i scazand pe 
aceasta cale specificitatea. Aceasta relatie intre sensibilitate §i specificitate impune o 
„alegere optima” a pragului, functie de criteriile care sunt importante in anumite situatii 
concrete §i modul cum se calculeaza functia de cost a unei clasificari gre§ite. in functie 
de scopul urmarit in studiu, vom cauta o sensibilitate mai ridicata (chiar daca §tim ca va 
create numarul de fals pozitivi), iar in altele vom urmari o specificitate crescuta. 

Concluzii interesante se pot trage daca se urmare§te grafic relatia intre 
sensibilitate §i specificitate. Se reprezinta de obicei 

SN = f (1 - SP) 


Comparing ROC Curves 



False positive rate 


Curba ROC 

Graficul obtinut se nume§te curba ROC ( Receiver Operator Characteristic). 

Acest grafic are cateva proprietati interesante: 

- daca folosim un criteriu de clasificare fara putere de discriminare (de ex. un scor 
calculat absolut arbitrar), atunci curba ROC ar coincide cu prima bisectoare a 
planului, aria de sub curba reprezentand 50% din total 

- pe de alta parte, daca am avea un criteriu perfect (nici un fals pozitiv sau negativ, 
indiferent de pragul P), atunci aria de sub curba ROC va fi 100% 

- uzual curba ROC arata ca in fig. 1.4.; aria de sub curba ROC este un indicator 
global satisfacator pentru calitatea clasificatorului folosit §i se nume§te coeficientul 
c [46, 47, 48, 49, 50], http://gim.unmc.edu/dxtests/. 
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Coeficientul c 

Aria de sub curba ROC se mai nume§te §i „coeficientul c” §i reprezinta cel mai 
important indicator al acuratetei predictiei (scorului). 

Se accepta urmatoarea scara in functie de coeficientul c 
[http://gim.unmc.edu/dxtests] : 

0,91 - 1,00 = excelent 
0,81 - 0,90 = foarte bine 
0,71 - 0,80 = bine 
0,61 - 0,70 = satisfacator 
sub 0,60 = slab. 

Exemplu: Reluam exemplul cu cei 4000 subiecti dintre care 100 au avut viroza. 
Presupunem ca programul nostru de calculator a diagnosticat corect 90 dintre ei, insa a 
atribuit acela§i diagnostic (viroza) §i la alti 50 de subiecti. Caracterizati programul de 
diagnostic. 

Datele din text sunt prezentate sintetic in tabelul IV.5. 

Tabel IV.5. Exemplu pentm calculul parametrilor unui clasificator 



prog. calc. 

K+ K- 


B 

real 

90 

10 

100 

B- 

50 

3850 

3900 


- 

4000 


fals negativi 
fals pozitivi 
sensibilitatea 
specialitatea 
acuratetea 
rata erorii 


F - = 10 
F + = 50 

SN = 90 / 100 = 90% 

SP = 3850 / 3900 = 97,4% 

AC = 3940 / 4000 =98,5% 

RE = 60/ 4000 = 1,5% 


8. ALEGEREA INVESTIGATIILOR 

Calculatorul poate asista medicul in luarea deciziilor nu numai pentru stabilirea 
diagnosticului ci §i in alte actiuni, una dintre acestea fund alegerea investigatiilor, actiune 
desigur corelata cu stabilirea diagnosticului. Deseori medicul este solicitat de pacient sau 
familia acestuia sa recomande investigatii nu intotdeauna necesare sau relevante, uneori 
scumpe §i inavazive. Principalele elemente care intervin in luarea deciziei de recomandare 
sau nu a unei investigatii sunt: 

relevanta rezultatului pentru conduita terapeutica sau precizarea diagnosticului 
(se efectueaza o serie de calcule probabilistice pe baza regulii lui Bayes iar apoi, 
in functie de sensibilitatea §i specificitatea testului se estimeaza probabilitatea 
evolutiei in cele doua variante - cu sau fara rezultatul investigatiei) 

- tipul de investigate - invaziva, neinvaziva 
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costul investigatiei 

efecte secundare, contraindicatii, accidente. 


9. OPTIMIZAREA TRATAMENTULUI 

Chiar daca aplicatiile actuale acopera in mica masura aspectul optimizarii 
tratamentului medical, specialist! apreciaza ca in urmatoarele doua decenii aceasta va 
deveni aplicatia majora a informaticii medicale. Terapia actuala se bazeaza pe existenta 
unor scheme de tratament in care - in majoritatea cazurilor - pacientii sunt incadrati 
adoptandu-se cam acelea§i doze §i intervale de timp, cu variatii mai curand calitative, in 
cazuri de complicatii etc. Este un deziderat major al medicinei actuale terapeutice trecerea 
spre individualizarea tratamentului. Primul pas major se realizeaza prin realizarea unui 
“model individualizat al pacientului” pe calculator (cuprinzand caracteristicile sale 
relevante pentru aspectul analizat), asupra caruia se simuleaza diferite “variante de 
tratament”, alegandu-se varianta optima. 

Astfel de programe au §i fost realizate pentru optimizarea tratamentului tumorilor 
prin iradiere. Problema important! care trebuie rezolvata in aceste cazuri este atingerea 
dozelor terapeutice in regiunea tumorala fara insa a afecta regiunile strabatute de radiatii 
pana in zona tumorala. Iradierea sub mai multe incidence permite ca in zona tumorala, prin 
efect aditiv sa se cumuleze doza terapeutica, fara a depa§i limitele admise pentru celelalte 
regiuni. Programele de calculator folosite precizeaza incidentele §i dozele pentru fiecare 
incident! 


10. DECIZII LA NIVEL DE ORGANIZARE SANITARA 

O larga paleta de aplicatii este deschisa pentru asistarea deciziei la nivele centrale 

privind: 

• distribuirea resurselor in functie de prioritati §i necesitati 

• estimarea necesarului de medicamente, echipamente, infrastructura, personal 

• reactii operative in caz de epidemii, calamitati, accidente 

• elaborarea politicii sanitare in planuri de scurta §i lunga durata. 
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SISTEME INFORMATICE MEDICALE 




1. INFORMATIA MEDICALA 

in capitolele anterioare am trecut in revista numeroase aplicatii ale 
calculatoarelor in domeniul medical (crearea bazelor de date, prelucrari statistice, 
achizitia §i prelucrarea biosemnalelor §i imaginilor medicale, diagnostic asistat etc.), 
privite insa ca aplicatii punctuale, fara sa acordam atentie deosebita modului in care 
acestea se integreaza in ansamblul activitatilor medicale. in acest capitol vom arbora o 
privire sintetica pentru a aborda activitatile din domeniul medical ca pe un sistem, cu 
numeroase elemente structural, intre care circula informatii §i vom urmari masura in 
care tehnica de calcul poate sprijini aceste activitati precum §i particularitatile acestui 
sistem in ansamblul sau. 

§i deoarece elementul central urmarit aici este “informatia medicala”, vom 
incepe printr-o privire sintetica asupra acestei notiuni, pentru a putea defini conceptul 
de “sistem informatic”. 

Prima tentatie in a defini notiunea de “informatie medicala” ar fi de a-i limita 
sfera de cuprindere la informatii care privesc aspectele medicale din activitatea de 
ocrotire a sanatatii. Vom extinde insa sfera acestei notiuni astfel incat sa cuprinda orice 
informatie care apare in cursul activitatilor medicale, atat cele directe cat §i conexe. Sa 
trecem in revista tipurile de activitati, incat sa putem estima tipurile de informatii care 
apar in diverse locuri §i momente, pentru a putea analiza apoi cum aceasta informatie 
circula in sistemul medical / sanitar. 


1.1. Tipuri de activitati 

a) Activitati medicale directe - reprezentate tipic de “consultatia medicala”. 
Pentru a analiza tipurile de informatii vehiculate, vom distinge cateva faze / actiuni: 

i° - stabilirea diagnosticului - faza in care medicul folose§te doua categorii de 
informatii 

- date: un ansamblu de informatii cu caracter individual, cuprinzand: 
elementele culese in anamneza, datele de laborator, semnale, imagini 

- cuno§tinte: anasamblul de informatii generale pe care le achizitioeaza 
medicul in cursul pregatirii sale profesionale (prin instruire, experienta clinica, 
documentare, cercetare) 

ii° - tratament - faza in care medicul urmare§te rezultatele terapiei propuse 
stabilindu-se un permanent schimb de informatii intre medic §i pacient. 

iii° - nursing - denumire sub care acoperim toate activitatile privind ingrijirea 
pacientilor. 

b) Asigurarea logistica a activitatii medicale 

Cadrul in care se desfa§oara orice activitate necesita o activitate organizatorica, 
administrativa §i managerial^, mai simpla sau mai complexa, in functie de specificul 
activitatii §i de dimensiunea sistemului. Vor fi desigur deosebiri intre activitatile 
managerial la nivel de circumscriptie sanitara sau la nivel de spital. Aceste activitati 
“conexe” cuprind cel putin doua elemente principale: 

- activitati de administrare a unitatii 

- activitati fmanciar contabile. 
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Trebuie mentionat ca uneori aceste activitati ocupa un procent insemnat din 
timpul consumat de medic in activitatea sa de ansamblu. 

c) Integrarea in contextul social. Activitatea medicala nu este o actiune 
izolata, cu scop in sine, ci face parte din ansamblul activitatilor dintr-o societate, astfel 
incat rezultatele activitatii medicale trebuie sa fie vizibile la nivelul societatii. Acest 
lucru se atinge pe mai multe cai; vom accentua aid insa actiunea de centralizare a 
datelor medicale, prin care se raporteaza ierarhic datele sintetice cu ajutorul carora se 
obtine o imagine de ansamblu asupra activitatilor din domeniul ocrotirii sanatatii la 
nivelul unei comunitati / societati. 

d) Educatia medicala - este o actiune de importanta deosebita, fiind veriga 
esentiala in transmiterea informatiei medicale condensate sub forma de “cuno§tinte” 
medicale. Ea cuprinde: 

i° - invatamantul cadrelor medicale: 

- medici 

- cadre medicale 

- invatamant postuniversiatr, educatie continua 

ii°- educatia pacientilor - element deosebit de important pentru anumite 
categorii de pacienti (diabetici, gravide, astmatici, etc); acestui aspect i se acorda 
actualmente o atentie specials §i se realizeazS numeroase programe pentru categorii 
extinse de pacienti. 

e) Documentarea medicala 

in mod obi§nuit, dupS incheierea studiilor sursa principals de informare devine 
documentarea din cSrti §i reviste de specialitate. Acestora li se adaugS acum metodele 
computerizate, folosind fie revistele publicate pe compact-disc (CD), exemplul tipic 
fiind sistemul MEDLINE elaborat de National Library of Medicine din Bethesda 
(SUA), fie conectarea pe Internet, cu acces la diferite biblioteci de specialitate din lume, 
unele dintre acestea asigurand acces gratuit. Toate aceste forme de completare §i 
actualizare a cuno§tintelor, impreunS cu diverse cursuri post-universitare, se incadreaza 
in conceptul de educatie medicaid continua. 

f) Cercetarea medicala 

Cantitatea totala de informatie este in cre§tere rapida §i acest lucru se datoreaza 
dezvoltarii deosebite a cercetarii. Tehnologia informationala contribuie din plin la 
aceasta cre§tere rapida inclusiv a cercetarii medicale. Actualmente in toate institutiile de 
invatamant superior medical se desfa§oara §i o intensa activitate de cercetare, integrata 
de fapt in ansamblul activitatilor medicale. 

1.2. Structura schematic! a fluxului informational 

a) Schema fluxului informational 

Vom prezenta in continuare tipurile de informatii §i conexiunile de transfer a 
informatiilor legate de activitatea medicala (fig. V.l). 

Pozitia centrala in schema o ocupa axa PACIENT - MEDIC care reprezinta 
activitatea medicala primara §i genereaza toate celelalte actiuni. Medicul culege de la 
pacient informatia medicala sub forma de date, care cuprind atat elemente descriptive 
din anamneza cat §i alte date: rezultate de laborator, semnale, imagini etc. Aceste date 
au caracter individual. Ele sunt interpretate de medic pe baza cuno§tintelor sale de 
specialitate, obtinute prin educatie, documentare (carti, reviste, mijloace informatizate), 
experienta clinica, eventual §i cercetare. Interpretarea datelor conduce la stabilirea unui 
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diagnostic §i elaborarea unui plan terapeutic care se aplica pacientului. Efectele 
tratamentului sunt urmarite de catre medic inchizandu-se astfel un prim ciclu in care 
“noua” stare a pacientului privita ca “feed-back” in circuitul informational va determina 
o “noua” decizie a medicului (aid atributul “noua” reprezinta un nou moment, nu 
neaparat o alta stare sau decizie). Conform teoriei sistemelor, un sistem cibernetic in 
care exista un ciclu cu legatura inversa este considerat un sistem reglabil (controlabil). 



Fig. V. 1 . Schema fluxului informational in activitatea medical 


In ciclul descris aici datele au un “nivel individual”, acest lucru fiind marcat in 
schema printr-o linie intrerupta care desparte portiunea superioara de cea inferioara a 
figurii. 

Caracterul individual al informatiilor se pierde atunci cand datele se 
centralizeaza pentru mai multi pacienti, de la mai multi medici, fiind supuse unor 
prelucrari statistice la NIVEL CENTRAL. Se obtine o imagine de ansamblu asupra 
starii de sanatate a populatiei, aceasta fiind o informatie medicala la “nivel de 
comunitate”. Cunoa§terea situatiei la nivelul societatii permite luarea unor masuri de 
imbunatatire a activitatii de ocrotire a sanatatii prin: masuri profilactice, vaccinari, 
eventual actiuni deosebite (in epidemii), orientarea unor fonduri spre anume activitati 
achizitionari de medicamente, echipamente etc. Masurile luate se rasfrang asupra 
intregii SOCIETATI, implicit asupra pacientilor ca indivizi. Acesta poate fi considerat 
ca un al doilea ciclu al fluxului informatiei medicale. 

Circuitul se inchide §i prin influenta pe care o poate avea informatia la nivel 
central cu efect asupra cre§terii/imbunatatirii bazei de cuno§tinte, cum ar fi orientari ale 
unor teme de cercetare, dezvoltarea invatamantului etc. Acesta ar fi al treilea ciclu al 
fluxului informational. Sa nu trecem cu vederea ca toate masurile la nivel central depind 
de resursele disponibile pentru astfel de actiuni, care - la randul lor - sunt distribuite de 
catre societate. 
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Se observa din schema caracterul complex al transferului de informatie in 
activitatea medicala, numeroasele legaturi §i tipurile diferite de informatii. 

b. Nivele de organizare a activitatii medicale 

Putem distinge in activitatea medicala patru nivele de organizare: 

- asistenta medicala primara - asigurata la nivelul circumscriptiilor sanitare de 
catre medici de medicina generala §i / sau medici de familie 

- asistenta medicala de specialitate - asigurata la nivelul cabinetelor §i / sau 
clinicilor de specialitate, avand §i suportul unor servicii paraclinice 

- spitalul ca unitate de organizare a asistentei medicale de specialitate 

- nivele centrale-decizionale: directii sanitare, ministere, legaturi cu organisme 
international (Organizatia Mondiala a Sanatatii). 

1.3. SlSTEM INFORMATIONAL, SISTEM INFORMATIC 

Dupa ce am urmarit schema fluxului informational in activitatile medicale, 
putem da acum doua defmitii: 

a. Sistemul informational reprezinta un ansamblu de unitati structural intre 
care are loc un schimb de informatii. 

b. Sistemul informatie reprezinta partea din sistemul informational care 
cuprinde utilizarea calculatoarelor. 

Procentul ocupat de sistemele informatice medicale in ansamblul sistemelor 
informational variaza de la o tara la alta §i de la un nivel la altul. Peste tot insa se 
constata o marcata tendinta de cre§tere, actuala generatie de studenti medicini§ti din 
Romania fiind cu siguranta printre cei care vor contribui la cre§terea acestui procent in 
tara noastra. 


2. SISTEME INFORMATICE IN ASISTENTA MEDICALA 
PRIMARA 

In cele ce urmeaza vom particulariza aspectele privind fluxul informational in 
cadrul asistentei medicale primare. 

Asistenta medicala primara constituie primul contact al unui pacient cu 
sistemul medical, in tara noastra asistenta primara este asigurata in cabinete private de 
medicina generala sau medici de familie. 

2.1. Activitati la nivelul unitatilor de asistenta medicala primara 

a) activitati medicale propriu-zise, cuprinzand: consultatii, vizite, urmarirea 
unor categorii speciale de pacienti (bolnavi cronici, gravide, copii sub un an), urgente 

b) documentare 

c) organizare §i management la nivelul circumscriptiei (cabinetului). 

Calculatoarele pot veni in facilitarea acestor activitati. Vom prezenta in 

continuare tipurile de programe pe care ar trebui sa le contina un calculator al unui 
medic de medicina generala. Sunt trecute §i elemente (programe) privind aspecte care 
insa nu sunt defmitivate in tara noastra dar vor fi cu siguranta introduse in viitor - ne 
referim aici in special la introducerea asigurarilor de sanatate, directie in care s-a 
acumulat multa experienta in alte tari §i in care aportul calculatoarelor este deosebit de 
important. 
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2.2. Modulele sistemelor informatice ale asistentei medicale primare 

1°. Modulul de baza 

Modulul de baza, obligatoriu in unele tari, cuprinde programele cel mai des 
folosite impreuna cu fi§ierele aferente. Putem clasifica aceste componente in: 

a) Fi§iere de date medicale cuprinzand: 

- registrele tuturor pacientilor - de fapt a tuturor persoanelor in evidenta 
circumscriptiei 

- date “demografice”, inclusiv date despre asigurarile medicale ale pacientilor 

- posibilitatea gruparii datelor pe familii (gospodarii) 

b) Programe de administrare a activitatii medicale 

- registre (fi§iere) pentru: consultatii, vizite, teste de laborator 

- elaborarea unor documente financiare simple - note de plata 

- programe simple pentru diferite centralizari (medicamente etc.) 

c) Programe utilitare ce asigura desfa§urarea unor operatiuni ca: 

- asigurarea protectiei datelor 

- lucrul in partitie (cand sunt mai multe terminale: in cabinetul medicului, la 
asistenta de receptie, in sala de laborator/investigatii, in sala de tratamente etc.) 

- salvarea datelor (“back-up”) - o operatiune deosebit de importanta: este 
obligatoriu ca zilnic sa se copieze toate fi§ierele de date pentru a putea fi restaurate in 
cazul unor defectiuni ale sistemului de calcul. 

2°. Modulul medical 

Are in pozitie centrala fi§a de observatie, care este “placa tumanta” cu rol 
cheie in aplicatiile medicale (acest modul se mai intalne§te sub numele EPR - 
“electronic patient record”, sau CPR - “computer - based patient record”). 

a) Fi§a de observatie contine: 

- date de identificare (cod personal, nume-prenume-adresa) §i alte date 
personale 

- date medicale - care se tree grupate cronologic §i cuprind: 

= antecedente personale §i heredo - colaterale (istoric) 

= date ale examinarii (ex: puls, presiune arteriala, alte observatii) 

= rezultate de laborator (hemograma, examen de urina, etc.) 

= semnale (ECG, EEG etc.) 

= imagini (radiografie, scintigrafie etc.) 

= prescripts de medicamente, alte tratamente 
= trimiteri spre asistenta de specialitate. 

Din punct de vedere al formei de inscriere, datele pot fi grupate in: 

- date sub forma de text 

- date numerice (cu precizie prestabilita) 

- date codificate 

- semnale §i imagini (in aceste situatii se folose§te termenul de format 
“multimedia”) 

b) Codificarea - este o operatiune frecvent intalnita pentru o prezentare sub 
forma prescurtata a unor informatii. Ea a fost introdusa initial pentru evidenta cauzelor 
de deces §i extinsa ulterior pentru descrieri complexe. Ansamblul de coduri folosite 
pentru un scop anume formeaza un nomenclator. Cele mai raspandite sisteme de 
codificare sunt: 
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i° - ICD10 (International Classification of Diseases) versiunea 10-a, cu cea mai 
larga raspandire - este un sistem uniaxial, folsind un cod dupa un singur criteriu - 
diagnosticul 

ii 00 - SNOMED (Systematized Nomenclature of Human and Veterinary 
Med icine); este un sistem multiaxial, cu coduri separate pentru topologie, etiologie, 
morfologie, boala etc. 

c) Prescripts medicamentelor 

Elaborarea prescriptiei de tratament, este asistata de programele mai recente 
intr-o forma destul de dezvoltata, avand posibilitatea de a avertiza medicul de anumite 
situatii, de genul: 

- un medicament cu actiune similara mai este inclus in tratament 

- medicamentul respectiv este contraindicat in... (de ex. sarcina, etc.) 

- medicamentul respectiv nu este platit de firma de asigurari, etc. 

d) Trimiteri 

Modulul medical contine §i programe pentru editarea §i tiparirea scrisorilor de 
trimitere pentru diferite analize catre cabinetul de specialitate sau spitale. 

3°. Modulul programari 

Cu consecinte importante in economisirea timpului atat al pacientilor cat §i al 
medicului; contine: 

- evidenta programarilor de consultatii 

- planificarea vizitelor 

- programarea unor actiuni speciale (vaccinari etc.) 

- redactarea unor scrisori privind programarile 

4°. Modulul farmacie 

Unitatile de asistenta primara au de obicei §i o dotare cu o serie de 
medicamente strict necesare §i pentru urgente; ca o uzanta de activitate, cu ocazia 
consultatiei (vizitei) se pot administra deja unele medicamente, urmand ca restul sa fie 
achizitionate conform retetei; acest lucru este foarte important in circumscriptiile rurale. 
Modulul farmacie contine de obicei: 

- evidenta medicamentelor in stoc 

- elaborarea comenzilor 

- liste de gratuitati / compensate 

- lista furnizorilor 

- date cumulative privind medicamentele prescrise intr-un anumit interval de 

timp. 

Observatie: in multe tari casele de asigurari stabilesc “plafoane” de cheltuieli pentru 
tratamente, care sa nu fie depa§ite de catre medici, de aceea, in mod uzual un doctor 
dore§te sa-§i cunoasca in orice moment nivelul la care a ajuns, comparativ cu plafonul 
prevazut. 


5°. Modulul financiar 

in afara de un program financiar-contabil inclus in modulul de baza, medicul 
generalist necesita un modul dedicat care sa-i satisfaca integral necesitatile administrarii 
fmanciare a unitatii, cuprinzand programe pentru: 

- note de plata privind activitatile prestate 

- statele de plata ale personalului 
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- registrul contabil, inclusiv impozite 

- corespondenta financiara. 

6°. Modulul de comunicatie 

Unitatile medicale nu sunt entitati izolate, avand pozitii bine precizate intr-o 
intreaga retea de asistenta medicala; totodata are legaturi §i cu unitati apartinand altor 
retele. Se apreciaza ca nivelul actual de comunicare este nesatisfacator, datele de interes 
pentru un medic (cum ar fi cele privind tratamentele aplicate unui pacient intr-o unitate 
specializata) sosind deseori incomplete §i cu intarziere. Este evident ca o conexiune a 
unitatilor de asistenta primara cu cele specializate (spitale) ar imbunatati cu mult 
situatia, oferind posibilitatea transferului rapid §i complet de informatii. 

7°. Dezvoltari ulterioare 

De§i satisfac o buna parte din necesitati, programele actuate pot fi inca 
imbunatatite prin adaugarea unor facilitati suplimentare: 

- documentarea asistata - tehnici de data mining aplicate pentru resurse web 

- adaugarea unor module de sisteme expert pentru asistarea deciziei medicale, 
in special diagnosticul (in momentul de fata sistemele expert au o aplicare inca destul de 
restransa §i sunt cel mai adesea utilizate in clinici de specialitate). 

- ridicarea nivelului de standardizare a fi§ei de observatie. 


3. SISTEME INFORMATICE CLINICE 

Caracteristica esentiala a sistemelor informatice clinice este ca sunt orientate 
pe pacient, adica fi§a pacientului este documentul primar §i toate relatiile §i 
conexiunile intre departamente se fac cu referire la pacient. De aceea identificatorul 
pacientului este un element important pentru regasirea facila §i urmarirea datelor. 

3.1. Structura asistentei specializate in clinici 

Un pacient trimis de la nivelul asistentei medicale primare la nivelul asistentei 
de specialitate va intra in evidenta unui departament clinic, insa pentru obtinerea unei 
imagini complete asupra starii sale se apeleaza la o serie de servicii disponibile in 
departamente paraclinice. in principiu putem considera ca un sistem policlinic contine 
doua categorii de departamente: clinice §i paraclinice. Pentru un pacient se poate apela 
la serviciile oricarui departament paraclinic, iar aceste departamente paraclinice servesc 
toate departamentele clinice. Putem enumera principalele departamente de specialitate: 

a) Departamente clinice 

- medicina interna, subdivizate in: cardiologie, nefrologie etc. 

- chirurgie, subdivizate la randul lor 

- pediatrie 

- monitorizari 

- psihiatrie 

- neurologie 

- bob infectioase etc. 

b) Departamente paraclinice §i servicii 

- radiologie §i imagistica 

- medicina nucleara 

- explorari functional 
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- laborator clinic 

- endoscopie 

- laborator anatomo-patologie 
- terapie 

- farmacie etc. 

3.2. Obiective generale ale sistemelor informatice clinice 

a. Planificarea ingrijirii §i interventiilor asupra pacientilor. 

b. Gestiunea datelor pacientilor: 

- achizitia, stocarea §i regasirea datelor (referitoare la anamneza, date de 
laborator, biosemnale, imagini etc) 

- verificarea §i codificarea datelor 

- prelucrarea datelor 

- prezentarea integrate - in aceasta directie exista o avalan§a de programe ce 
propun numeroase variante ce pot oferi sintetic datele esentiale §i cu acces u§or §i rapid 
la orice alte elemente, cuprinzand inclusiv imagini §i grafice. 

c. Asistarea deciziei medicale - prin programe de: 

- diagnostic asistat 

- optimizare a terapiei 

- simulari de evolutii, inclusiv simulari de interventii pe modele. 

d. Obiective educationale - de exemplu sfaturi pentru pacienti. 

e. Monitorizari §i urmarire - estimarea evolutiei starii pacientilor este un 
obiectiv esential al asistentei medicale §i permite reactia oportuna pentru modificarea 
tratamentului dupa necesitati; de aceea programele de calculator trebuie sa permita 
obtinerea rapida §i facila a datelor solicitate prezentate intr-o forma u§or interpretabila. 
Adaugam aid ca o categorie speciala programele folosite pentru monitorizarea in 
terapia intensiva. 

f. Raportare - activitatea medicala presupune redactarea periodica a unor 
rapoarte cuprinzand date sintetice ale activitatii, din care se va estima la nivel central 
starea de sanatate a populatiei in vederea adoptarii celor mai potrivite masuri pentru 
imbunatatirea activitatilor de ocrotire a sanatatii §i asistenta medicala. Redactarea 
acestor rapoarte, care este o actiune consumatoare de timp este mult u§urata prin 
utilizarea unor programe pentru: 

- centralizarea datelor 

- analiza statistic^ 

- generare de rapoarte (exista chiar forme standard care pot fi elaborate periodic). 

g. Evaluarea calitatii asistentei medicale §i a rezultatelor obtinute - 

stocarea u§oara a unui numar mare de date, regasirea lor rapida §i prelucrarea comoda 
permite aprecierea ori de cate ori este nevoie - a evolutiei bolilor (in special in bolile 
cronice sau congenitale). 

Putem include aici §i o alta categorie de programe, care permit o estimare 
realista a calitatii asistentei medicale pentru imbunatatirea planificarii activitatilor §i 
resurselor in viitor §i chiar pentru orientarea unor activitati de cercetare. 

3.3. Obiective specifice ale sistemelor informatice in departamente 

CLINICE 

Fara a avea pretentia la o prezentare exhaustive a aplicatiilor calculatoarelor in 
fiecare specialitate, deoarece am prezentat anterior o serie de obiective generale, ne vom 
limita la o enumerare succinta a unor aplicatii specifice, intalnite mai des in anumite 
clinici. 
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a) Medicina interna 

- Cardiologie: una din disciplinele clinice cu exprimarile cele mai exacte, cu 
modele matematice dezvoltate §i marimi mai u§or de cuantificat, folosind investigate 
destul de precise. Sunt tipice prelucrarile de semnale ECG §i echocardiografia, precum 
§i de imagini (angiografie coronariana §i scintigrafie cardiaca) 

- Boli metabolice: este specifica urmarirea pe lunga durata; pentru diabetici s- 
au creat o serie de programe de educatie a pacientilor 

- Hematologie: s-au creat registre de hemofilie, cu date detaliate privind testele 
§i simptomele §i care reamintesc pacientilor programarile la consultatii 

- Nefrologie: baze de date intemationale cu liste de prioritati pentru transplant 
renal precum §i programe de telecomunicatie intre statiile de dializa la domiciliu §i 
spital pentru monitorizarea pacientilor cu insuficienta renala cronica 

- Gastroenterologie: prelucrari de imagini endoscopice, inregistrari multimedia 
(cu secvente video), regasirea imaginilor §i compararea lor. 

b) Chirurgie -aplicatii pentru: 

- planificarea operatiilor 

- pregatirea §i controlul interventiilor chirurgicale 

- monitorizarea pacientilor in timpul operatiilor 

- simularea unor operatii prin tehnici de “realitate virtuala” - programe deosebit 
de utile pentru pregatirea viitorilor speciali§ti. 

c) Oncologie - s-au realizat programe speciale pentru: 

- codificari specifice (ONCOTOP) 

- asistarea proiectarii terapiei cu radiatii 

- elaborarea protocoalelor de chimioterapie 

- centralizarea specifica pentru “Registrul national de cancer” 

- prelucrari statistice specifice, inclusiv analiza supravietuirii §i compararea 
tratamentelor. 

d) Obstetrica: 

- urmarirea sarcinii 

- prelucrarea ultrasonocardiogramelor fetale 

- educarea pacientelor 

- estimarea calitatii ingrij irii gravidelor 

- monitorizarea in timpul travaliului. 

e) Pediatrie 

- baze de date pentru prematuri, cu programe speciale de urmarire a evolutiei 

cre§terii 

- depistarea precoce §i urmarirea bolilor congenitale 

- alte aplicatii sunt similare cu cele enumerate la medicina interna sau 
chirurgie, insa aplicate specific pentru copii de diferite varste. 

f) Psihiatrie 

- baze de date 

- programe de interpretare a unor teste specifice 

- sisteme de diagnostic asistat (variabilitate destul de larga a diagnosticului). 

g) Neurologie - domeniu foarte exact in stabilirea diagnosticului - programe 

pentru: 
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- estimarea gradului de disabilitate (scoruri) 

- fi§a de observatie specified 

- controlul terapiei. 

h) Monitorizari - cu programe specifice pentru diverse tipuri; se manevreaza 
foarte multe date; calculatoarele folosite au placi de achizitie de semnal, cu mai multe 
canale; exemple de tipuri de monitorizari asistate de calculator - in: 

- unitati coronariene 

- terapie intensiva / anestezie - reanimare 

- urmarirea pre / post - operatorie 

- monitorizarea perinatala 

- administrarea bazei de organe pentru transplant. 

3.4. Obiective specifice In depart amente paraclinice §i servicii 

a) Explorari functional - se inregistreaza diverse semnale biologice: 

- explorari respiratorii 

- ECG, EEG, EMG 

- investigate in efort, etc. 

b) Radiologie §i imagistica - au specific obtinerea de imagini §i necesita 
calculatoare cu mare capacitate de stocare, memorie mare §i viteza ridicata de transfer a 
datelor: 

- radiografie (radioscopie) 

- CT (computer - tomografie) 

- RMN (rezonanta magnetica nucleara) 

- PET (“positron emission tomography”) 

- imagini echografice. 

c) Laboratorul clinic - o serie de particularity pot fi mentionate aici: 

- identificarea probelor prin coduri cu bare (“bar codes” - care ofera o mare 
operativitate) sau dispozitiv de citire OCR ( Optical Character Readers) 

- automatizarea comenzii (solicitarii) de analize - in cazul in care este un 
pacient intemat aceasta poate fi transmisa prin retea §i pe aceea§i cale pot fi primite §i 
rezultatele - inclusiv cu precizarea metodei (unele teste pot fi realizate prin mai multe 
metode §i exista u§oare diferente intre domeniile “normale” acceptate in fimctie de 
metoda) 

- multe aparate de laborator permit o conectare la calculator §i au grad inalt de 
automatizare al procesarii. 

d) Laboratorul de patologie - cu rol important in diagnoza a doua tipuri de 

probe: 

- pe probe bioptice de la pacienti 

- pentru diagnoza post mortem. 

in activitatea medicului patologist un rol important il joaca “experienta” 
ca§tigata prin “citirea” unui numar imens de lame; deseori medicul patologist apeleaza 
la carti §i atlase cu diverse imagini §i le compara cu cazul real; acestea pot fi acum 
furnizate de calculator; de asemenea s-au realizat unele sisteme expert care apeleaza la 
o serie de parametri numerici (numar de mitoze, dimensiunea §i forma nucleilor, 
continutul de AND). 
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e) Farmacia 

Sistemul informational al unei farmacii de spital, care asigura servicii pentru 
toate celelalte departamente are numeroase sarcini ce pot fi grupate in: 
i° - activitati legate de asistenta medicala: 

- evidenta tuturor retetelor servite 

- verificarea prescriptiilor 

- fumizarea de informatii la zi doctorilor §i asistentelor 

- prepararea retetelor magistrale 
ii°- activitati logistice: 

- aprovizionare 

- evidenta stocuri §i termene de valabilitate 

- lista fumizorilor 

iii° - activitati managerial. 


4. SISTEME INFORMATICE DE SPITAL (SIS) 

Spitalul reprezinta unitatea tipica de organizare a asistentei medicale de 
specialitate. in paragraful precedent am trecut in revista sistemele informatice din 
departamentele implicate direct in asistenta medicala: departamentele clinice, 
paraclinice §i servicii medicale. Spitalul constituie un sistem complex, care integreaza 
atat activitatile medicale din departamentele clinice §i paraclinice, cat §i intregul lant de 
activitati conexe (administrative, fmanciare §i manageriale). 

4.1. Tipuri de date in spital 

Disponibilitatea informatiilor, in special sub forma de “date” este un factor 
cheie in functionalitatea unui sistem atat de complex. 

Trebuie sa facem aici distinctie intre doua tipuri de date: orientate pe pacient, 
respectiv orientate pe spital. 

a) Date orientate pe pacient - sunt datele primare ale departamentelor clinice 
§i paraclinice; din fi§ierele pacientilor se construiesc celelalte fi§iere - rapoarte, 
centralizari etc. Continutul datelor orientate pe pacient este dinamic §i in cre§tere prin 
dezvoltarea metodelor de investigate §i terapeutice. 

b) Date orientate pe spital - care cuprind datele referitoare la intreaga 
activitate managerial^ §i fmanciar contabila precum §i datele sintetice extrase din 
fi§ierele activitatii medicale directe. 

4.2. CONCEPTUL DE SIS 

Pentru a putea mai bine defini notiunea de Sistem Informatic de Spital prin 
sfera sa de cuprindere sa trecem in revista principalele functiuni pe care trebuie sa le 
indeplineasca: 

- sprijinirea activitatilor zilnice la nivelul asistentei medicale directe 

- suport in planificarea acestor activitati 

- sprijin in actiunea de control §i corectie a activitatilor medicale 

- extragerea informatiilor cu caracter statistic -populational 

- accesul la baza de date medicale pentru cercetarea clinica 
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a) Scopul SIS: utilizarea calculatoarelor pentru colectarea stocarea §i 
prelucrarea informatiei privind asistenta acordata pacientilor, precum §i administrarea in 
toate activitatile legate de spital §i a satisfacerii cerintelor functionale. 

Crearea unui SIS asigura: 

- o utilizare mai eficienta a resurselor (intotdeauna limitate!) disponibile 
pentru asistenta acordata pacientilor 

- imbunatatirea calitativa a serviciilor oferite 

- un sprijin operativ pentru nivelele centrale in vederea cunoa§terii starii de 
sanatate a populatiei intr-un teritoriu 

- cadrul adecvat pentru invatamantul medical §i pentru cercetare. 

b) Componentele SIS 

- Baza de date a pacientilor. Cum in centrul activitatilor medicale se gase§te 
pacientul, pozitia centrala in SIS o ocupa aceasta baza de date. Ea trebuie creata astfel 
incat dezvoltarea ulterioara a tehnicii de calcul sau limbajelor sa permita utilizarea ei in 
continuare. 

- Aplicatiile - reprezentate de diferitele programe de prelucrare a datelor din 
baza de date, pornind de la programele simple pentru introducerea §i modificarea 
datelor, prezentarea fi§ei pacientului, reprezentari grafice pentru evolutia pacientului 
pana la programe de centralizare pe zile, boli, tratamente, medicatii, investigatii precum 
§i analize statistice de diverse tipuri. 

- Sistemul de comunicatie -care cuprinde facilitatile de legatura intre baza de 
date §i utilizatorii individuali; la acest nivel se poate realiza limitarea acccesului 
diferitilor utilizatori. 

- Terminalele de lucru - care se gasesc distribuite in clinici, laboratoare, 
servicii §i birouri. 


Schematic putem reprezenta componentele SIS ca in figura V.2. 



Figura V.2. Componentele sistemului informatic de spital: utilizatorii de la 
terminalele de lucru T au acces la baza de date BD prin sistemul de 
comunicatie C, folosind diferite aplicatii A 
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4.3. Arhitectura unui SIS 

Evolutia sistemelor informatice de spital a relevat posibilitatea unor abordari 
diferite, cele mai uzuale arhitecturi fiind: 

a) Sisteme monolitice - concepute §i construite intr-o viziune unitara initiala; 
au avantajul unei bune compatibilitati intre componente, insa dezavantajul de a fi 
scumpe ca investitie unitara; s-au dovedit a fi mai putin flexibile §i mai greu de conectat 
la sisteme exteme diferite sau de adaptat la cre§teri neprevazute. 

b) Sisteme evolutive - care au aparut ca necesitate a adaptarii permanente a 
arhitecturii la necesitati; putem aici distinge doua situatii: 

- extinderea sistemelor monolitice (sisteme evolutive de tip I) prin adaugarea 
de noi componente 

- conectarea unor sisteme izolate (sisteme evolutive de tip II) care sunt cele 
mai frecvente. Foarte multe SIS actuale au aparut prin integrarea la un moment dat a 
unor sisteme departamentale izolate. De§i exista numeroase dezavantaje (deseori 
fi§ierele bazelor de date nu au conceptie unitara), se folosesc limbaje diferite §i 
calculatoare diferite, marele avantaj al cheltuielilor mai reduse §i dezvoltarile flexibile 
au facut ca acest sistem sa fie cel mai frecvent. 

c) Sisteme distribuite - destul de asemanatoare ca idee cu sistemele evolutive 
de tip II, prin adoptarea in arhitectura a unor componente diferite, care pot chiar rula pe 
platforme diferite (cu diferite sisteme de operare) §i sa comunice cu baza de date pe 
baza unor protocoale standard de comunicatie. 

4.4. Structura unui SIS 

in schema din figura V.3 este prezentata structura unui SIS. 


STRUCT 

Deo. ParaClinice C 

PC Laborator — 

Radiologie — 
Explorari Funct — 
Farmacie— 
Dep. Dire ft° r - 

URA S.I.S. 

Deo. Clinice - CD 

— Cardiologie 

— Nefrologie 

* Retea Spital 

Chirurgie 

— Obstetrica-Ginecologie 

— Pediatrie 

— Psichiatrie 

'\ 

Gateway 

VCIENT 

>ITAL 

ADM. j" ' | 

Contab. Aproviz.f" 

Date orientate pe 
Date orientate pe SF 


Figura V.3. Structura unui sistem informatic de spital 


Un astfel de sistem contine doua magistrale de comunicatie: 

a) - magistrala de date medicale - la care sunt conectate toate departamentele 
care lucreaza cu date orientate pe pacient , atat departamentele clinice, notate DC 
(medicina interna: cardiologie, nefrologie, gastroenterologie, endocrinologie, boli 
metabolice, hematologie; departamente chirurgicale: chirurgie generala, urologie, 
neurochirurgie, chirurgie cardio-toracica, ORL, oftalmologie; departamente complexe: 
oncologie, obstetrica - ginecologie; pediatrie, psihiatrie, boli infectioase (de obicei 
localizate in cladiri diferite - etc), cat §i departamentele paraclinice (laborator clinic, 
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radiologie §i imagistica, endoscopie, explorari functionale, laborator de patologie, 
medicina nucleara, anestezie etc.), departamente de monitorizare (terapie intensiva, 
imitate coronariana, reanimare, dializa), departamente de servicii medicale (farmacie, 
centrul de transfuzii, medicina legala, morga) etc. 

b) - magistrala de date de spital - la care sunt conectate toate serviciile 
administrative , manageriale §i de suport logistic: blocul operator, blocul alimentar, 
serviciul tehnic/intretinere, statia de salvare, serviciul aprovizionare, serviciul personal, 
contabilitate-fmanciar §i conducerea spitalului. 

4.5. INTEGRAREA SIS 

Notiunea de “integrare” in terminologia de aici reprezinta faptul ca SIS nu este 
izolat (retea locala), ci conectata la alte sisteme informatice, cu activitati conexe, intre 
SIS §i respectivele retele. 

in figura V.4 este prezentata o schema cuprinzand conexiunile posibile ale 
unui sistem informatic de spital, cu alte retele cu care exista permanente schimburi de 
date. Schimburile intre retele sunt asigurate prin calculatoare de comunicatie numite 
“Gateway”, care permit cuplarea unor calculatoare cu sisteme de operare diferite (Unix, 
Windows, DOS, Apple). 


Retea Academica S-l-S. INTEGRAT 

| 

\ 

Server Documentare 

Administrator 

V 

1 Retea biblioteca 1 

Re tea 

Gateway^ , 



1 Utilizatori 

Sali de _ 

Depart.- 

~ Dep. Cl in ice 

Clasa _ 

ParaClin. 

^ 



Retea Spital 

Dep.Adm. 



! 




Primara 

Retea Cercetare 

? 1 i i 

, , 

, 

| Medici Familie (Med. Gen.) 

| Laboratoare Cercetare Internet, Email | 


Figura V.4. Integrarea unui sistem informatic de spital 

Sistemul integrat cuprinde urmatoarele componente: 

a) SIS - Reteaua de spital - care in contextul nostru constituie “coloana 
vertebrala” a intregrului sistem, §i este reprezentata prin portiunea intre cele doua 
servere “gateway”. 

b) Reteaua academica - marile unitati spitalice§ti constituie §i o baza de 
invatamant: atat a viitorilor medici §i cadrelor medii auxiliare (asistente, tehnicieni, 
etc.), cat §i invatamantului postuniversitar. Acesta are loc atat in forma traditionala 
(rezidentiat - formare a medicilor de specialitate), cat §i ca “educatie continua” pentru 
aducerea la zi a nivelului cuno§tintelor cadrelor medicale, in conditiile actuale in care 
apar continuu noi cuno§tinte, metode, medicamente. Reteaua academica permite 
utilizarea bazelor de date ale clinicilor §i programelor pentru procesul educational. 
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c) Reteaua de biblioteca - cu menirea de a asigura documentarea cadrelor 
medicale §i a studentilor. Cel mai adesea o astfel de retea are un “server” cu posibilitati 
de a servi simultan multe sisteme de calcul conectate la Internet. 

d) Reteaua de cercetare - omniprezenta in spitalele universitare, dar §i in alte 
spitale - permite cuplarea diferitelor laboratoare de cercetare in reteaua integrata; 
schimbul de informatii este bidirectional: laboratorul de cercetare necesita deseori date 
clinice in timp ce departamentele clinice doresc sa aiba la dispozitie cat mai curand cele 
mai recente noutati §tiintifice. 

e) Reteaua de asistenta medicala primara. Trebuie sa remarcam mai intai 
faptul ca sistemele informatice ale asistentei medicale primare sunt deseori izolate, insa 
sunt deja create premizele ca astfel de retele ce interconecteaza mai multe circumscriptii 
/ cabinete de medicina generala. Legarea acestor retele la un sistem integrat ofera 
avantaje atat medicilor generali§ti (prin accesul la datele pacientilor carora li se acorda 
asistenta de specialitate, prin accesul la bazele de cuno§tinte etc.) cat §i spitalului, pentru 
transfer rapid de date §i urmarirea ambulatorie lejera. 

4.5. Exemple de SIS 

Pana in prezent au fost realizate numeroase sisteme informatice de spitale. in 
literatura de specialitate sunt mentionate cateva mai deosebite, in care s-au experimental 
diferite solutii §i s-au creat de fapt standardele de constructie, astfel incat ele au putut fi 
actualizate pe paarcursul evolutiei tehnologice. 

- Sistemul HISCOM - creat de firma Hiscom din Olanda - este un sistem 
complet, cu grad inalt de integrare, inceput in 1975 

- Sistemul DIOGENE - creat la spitalul Cantonal din Geneva - cu arhitectura 
monolitica, construit in perioada 1971-1978 

- Sistemul MGS (Massachusetts General Hospital) - creat la Boston, in 
perioada 1965-1970 

Mai mentionam sistemele de la King's College (Londra), Universitatea din 
Hanovra, Spitalul din Stokholm, Spitalul de Reabilitare din Texas, Spitalul Universitar 
din Tokyo. Sistemul informatic al retelei de spitale VA (Veterans’ Administration) din 
Statele Unite este aproape in intregime in forma electronica (96% paperless ), fiind unul 
dintre exmplele de succes in domeniu. 

O prima incercare in Romania a fost un proiect de realizare a unui SIS la 
Spitalul Fundeni din Bucure§ti, demarat in anul 1980, dar nefmalizat. in prezent, un 
sistem informatic bine realizat, cu grad de complexitate deosebit este cel al Serviciului 
de Salvare din Bucure§ti. 


5. SISTEME INFORMATICE MEDICALE LA NIVEL CENTRAL 

in fiecare tara exista un specific al organizarii ierarhice a activitatilor 
medicale. in principiu insa se respecta structura prezentata de noi, pornind de la 
asistenta medicala primara asigurata in circumscriptii / cabinete de medicina generala, 
spre cea de specialitate, avand ca unitate fundamentals de organizare spitalul, conform 
schemei de flux informational prezentata in figura III.4.1. Dinspre aceste unitati care 
asigura asistenta medicala directa, se centralizeaza date catre a§a numitul nivel central. 
Aici se disting urmatoarele trepte specifice in Romania: 
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5 . 1 . Nivel teritorial 

DSJ (Directiile Sanitare Judetene) organizeaza §i supravegheaza activitatile de 
asistenta medicala la nivel teritorial - judet. La acest nivel se face centralizarea primara 
a datelor, fiind primul nivel de sinteza. 

in plus, in judete exista Case de Asigurari de Sanatate judetene, ca filiale ale 
Casei Nationale de Asigurari de Sanatate (CNAS) - ele raporteaza catre CNAS, dar au 
§i un anumit grad de autonomie locale. 

5 . 2 . Nivel national 

a) Ministerul Sanatatii - centralizeaza la nivel national datele privind 
ocrotirea sanatatii §i asistenta medicala. in cadrul MS functioneaza Centrul National de 
Statistic^ Sanitara care concentreaza toate informative §i redacteaza rapoartele de 
sinteza la nivel national. Pe acestea ministerul le analizeaza, le prezinta guvernului §i ia 
masurile cuvenite pentru ridicarea calitatii ocrotirii sanatatii §i asistentei medicale. 

De mentionat ca reteaua farmaceutica are o ierarhie teritoriala paralela retelei 
de asistenta medicala, datele fiind centralizate la Oficiul Central Farmaceutic. 

b) Casa Nationala de Asigurari de Sanatate (CNAS) - prime§te informatii §i 
fmanteaza serviciile de ingrijire a sanatatii din: asistenta primara la nivelul medicilor de 
familie, asistenta in ambulatorii de specialitate, asistenta in spitale (atat pentru 
afectiunile acute, cat §i pentru cele cronice). 

c) Alte ministere - in Romania, pe langa reteaua MS care satisface majoritatea 
actiunilor de asistenta medicala, exista unele ministere care au retele proprii de asistenta 
medicala: Ministerul Transporturilor, Ministerul Apararii Nationale §i Ministerul de 
Interne. 


d) Organe Centrale. Exista activitati cu caracter medical (direct sau conex), 
desfa§urate §i in alte organisme: 

- unitati ale Ministerului Muncii §i Protectiei Sociale (azile de batrani, 
inspectorate pentru handicapati etc.) 

- unitati ale Politiei Sanitar-Veterinare. 

Unitatile de nivel central (judetean sau national) au datoria de a asigura legatura cu 
diferite alte unitati in probleme comune (de ex. alimentarea cu apa, colectarea §i 
depozitarea gunoaielor, diverse aspecte ecologice etc.). 

Date DRG - baza informationala pentru finantarea spitalelor 

incepand cu 2004, finantarea spitalelor in Romania se face prin plata prospective 
bazata pe sistemul DRG (Diagnosis Related Groups). Sistemul a fost initial introdus 
experimental intr-un singur spital (Cluj, 1999) printr-un proiect fmantat de USAID, apoi 
in 23 de spitale (2002) experienta fiind apoi aplicata la nivel national. 

Sistemul DRG reprezinta o schema de clasificare a pacientilor care permite 
relationarea tipurilor de pacienti tratati intr-un spital (i.e. case-mix-\\X) cu costurile 
carora el trebuie sa le faca fata. Conceptia §i dezvoltarea sistemului a inceput la 
universitatea Yale la sfar§itul anilor 1960. Motivatia initiala pentru dezvoltarea lui a 
constituit-o crearea unui cadru care sa permita monitorizarea calitatii §i a utilizarii 
serviciilor in domeniul ingrijirii sanatatii. El s-a extins treptat in SUA §i in 1983 a 
devenit sistemul de plata prospective la nivel national pentru toti pacientii Medicare 
(i.e. toti cetetenii de peste 65 de ani din Statele Unite). 
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in prezent, sistemul DRG se utilizeaza nu numai pentru pacientii Medicare , ci este 
folosit ca metoda preferata de rambursare pentru majoritatea companiilor de asigurari §i, 
cu modificari, a fost introdus in Australia §i in mare parte din tarile europene. Evolutia 
sistemului DRG §i utilizarea lui ca unitate de baza in plata spitalelor reprezinta o 
recunoa§tere a rolului fundamental pe care case-mix-vX unui spital il joaca in 
determinarea costurilor. Utilizarea altor caracteristici in stabilirea costurilor (statutul de 
spital universitar, numarul de paturi, etc.) a e§uat in gasirea unor explicate 
convingatoare atat privind diferentele de costuri dintre spitale cat §i notiunile de 
complexitate a cazurilor tratate. Sistemul DRG a fost primul sistem operational care a 
oferit mijloacele de a defini §i a cuantifica notiunea de complexitate case-mix. 

Termenul de complexitate case-mix este utilizat ca referinta la un set de atribute ale 
pacientului care sunt inter-relationate dar distincte §i includ: severitatea bolii, 
prognosticul, dificultatea tratamentului, necesitatea interventiei §i intensitatea resurselor 
utilizate. 

In sistemul DRG original exista 25 de grupe diagnostice §i clasificarea pacientilor 
in acestea se face pe baza diagnosticelor ICD (. International Classification of Diseases 
recomandata de Organizatia Mondiala a Sanatatii) prin care este descris cazul respectiv. 
Majoritatea tarilor europene §i Australia au adoptat deja ICD- 10 (versiunea 10 ICD) 
uneori modificata la nevoile proprii, in timp ce Statele Unite a ramas inca pe ICD -9, 
care are mai multe grupe diagnostice. in diferite tari europene sistemul de clasificare §i 
fmantare a fost adaptat la cerintele §i cultura institutional;! proprii. 

Romania a inceput cu sistemul american §i continua cu cel australian, incepand cu 
jumatatea anului 2007. O dificultate majora o constituie dezvoltarea de valori relative 
locale pe baza datelor de costuri la nivel de pacient, precum §i organizarea §i 
dezvoltarea unei structuri de evaluare a calitatii serviciilor furnizate de spitale. 

Un sistem de codificare mai complex este SNOMED, care permite o abordare 
ontologica a informatiei medicale, dar inca nu este utilizat pe scara larga. 

5.3. Nivel international 

Este tot mai evident ca nici o tara nu poate neglija contextul global in care este 
integrate §i multe probleme (inclusiv de ordin medical) sunt comune. Deschiderea 
granitelor, circulatia intensa, turismul etc. impun intensificarea comunicarii 
internationale. in domeniul medical exista un organism cu sediul la Geneva: OMS - 
Organizatia Mondiala a Sanatatii, care are mai multe departamente f\ care asigura 
comunicarea datelor f\ informatiilor medicale la nivel mondial. Romania este membra a 
OMS inca de la infiintare (1950). 

Comunicarea la nivel international este asigurata §i prin intermediul unor 
societati sau asociatii internationale; de exemplu in domeniul informaticii medicale, 
Romania este membra atat a EFMI (Federatia Europeana de Informatica Medicala) cat 
§i IMIA (Asociatia Internationala de Informatica Medicala). 

Organismele internationale au rol informativ §i consultativ fiind deseori 
promotoarele unor proiecte preluate apoi la nivel national, in domeniul informaticii 
medicale problemele majore care se discuta privind sistemele informatice medicale 
integrate sunt cele referitoare la protectia datelor §i cele referitoare la standardizare, pe 
care le vom trece in revista in cele ce urmeaza. Ca §i in celelalte probleme legate de 
ingrijirea sanatatii, in informatica medicala Uniunea Europeana nu da directive ci doar 
face recomandari statelor membre. 
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6. PROBLEME SPECIFICE IN SISTEME INFORMATICE 

6.1. Protectia datelor 

Realizarea oricarui sistem informatic (de fapt orice conexiune intre 
calculatoare) ridica probleme legate de asigurarea confidentialitatii §i protectiei datelor. 
Apare aici o contradictie: pe de o parte unul din scopurile pentru care se realizeaza 
sistemele informatice este chiar asigurarea accesibilitatii datelor, pe de alta parte datele 
medicale au un specific aparte, caracterul individual privat impunand ca aceste date sa 
fie confidentiale. De asemenea, dorim sa asiguram integritatea lor, deci sa nu fie 
afectat continutul lor (fie accidental, fie intentionat). Termenii legati de aceste aspecte 
sunt urmatorii: 

a) Confidentialitatea - datele medicale ale unui pacient sunt considerate 
confidentiale; accesul la ele trebuie deci sa fie limitat la un numar redus de persoane. 

Metode de asigurare a confidentialitatii: folosirea unor parole pentru a accesa 
fie intregul fi§ier (sau unele campuri) fie programele; codificarea identitatii pacientului. 

b) Protectia datelor - reprezinta masurile impotriva deteriorarii accidentale - 
neatentie in manevrare, defectiuni tehnice. 

Metode uzuale de protectie: “salvarea” datelor §i programelor prin realizarea 
periodica (zilnica) a unor copii de siguranta ( back-up ) pe suport extern; de asemenea, se 
stabilesc ni§te reguli stricte de operare §i evidenta. 

c) Securitatea datelor - reprezinta masurile impotriva accesului sau 
deteriorarii intentionate a datelor sau programelor. 

Metode uzuale de securitate: introducerea unor parole de acces pentru diferite 
nivele sau chiar masuri hardware - folosirea unor cartele, chei etc. 

Asigurarea confidentialitatii §i integritatii componentelor SIS impune stabilirea 
unor masuri atat la nivelul conducerii spitalului cat §i la nivelul departamentelor. Ele pot 
fi grupate in trei categorii: 

i° - masuri hardware (sau de echipament): 

- uneori echipamentele centrale sunt duplicate 

- calculatorul central - intr-o sala incuiata, cu acces limitat 

- calculatoarele sa permita accesul dupa identificarea persoanei cu o cartela 
(magnetica, optica sau chip) 

- instalatie de avertizare a accesului neautorizat 

- protectie impotriva inundatiilor 

- instalatii de aer conditionat 

ii° - masuri software : 

- teste de verificare a programelor (cu date foarte variate) 

- teste de validare a datelor introduse (atat la introducere cat §i cu anumite 
periodicitati) 

- identificarea utilizatorului - cu parole - §i a nivelelor de acces prestabilite: 
citire integral sau partial; se recomanda modificarea periodica a parolelor 

- pastrarea versiunii anterioare 

- evidenta actualizarilor in toate fi§ierele in care apar date ce se modified 

iii° - masuri organizatorice care trebuiesc sistematizate intr-un “Regulament 
al sistemului informatic” §i care trebuie sa includa cel putin: 

- precizarea exacta (separarea) a sarcinilor 
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- prevenirea situatiilor in care prea multe privilegii apartin unei singure 
persoane (situatii care cresce riscul de abuz) 

- clasificarea datelor in grupe diferite, cu acces depinzand de tipul de date 

- legarea accesului la date de vechimea lor sau de originea lor 

- elaborarea unor manuale de operare pentru fiecare fimctie in sistem, cu 
precizarea procedurilor de urmat in diferite situatii 

- managementul autorizatiilor trebuie de asemenea elaborat tinand cont de 
structura organizatorica a unitatii. 

6.2. Standardizarea 

Termenii de standard §i standardizare, folositi frecvent in tehnica pareau a fi 
greu adaptabili la activitatea medicala care manevreaza numeroase notiuni fuzzy 
(definite vag). Totu§i, in ultimul timp se discuta din ce in ce mai intens despre 
standardizare pentru cel putin doua motive: 

- asigurarea calitatii serviciilor prin instalarea unor norme precise pentru toate 
activitatile, asigurandu-se o responsabilitate bine precizata a tuturor persoanelor 
implicate in ansamblul activitatilor 

- posibilitatea schimbului eficient de informatii intre unitati diferite - prin 
precizarea semnificatiei termenilor. 

a) Definitii -dupa ISO {International Standards Organization). 

Standardizare - operatiunea de stabilire a unor reguli de desfa§urare a unor 

actiuni, privind probleme actuale sau potentiate, pentru atingerea unui grad optim de 
ordine intr-un context dat. 

Standard - este un document stabilit prin consens §i aprobat de un organism 
recunoscut, ce stipuleaza, pentru actiuni comune §i repetate, reguli §i criterii pentru 
activitati sau rezultatele lor, cu scopul de a atinge un grad optim de ordine intr-un 
context dat. 

Standardele din domeniul informaticii medicale permit interoperabilitatea intre 
sistemele informationale de sanatate. 

b) Organisme nationale §i internationale 

- ONS - Oficiul National de Standarde din Romania, Comitetul Tehnic 319 

- CEN - Comitetul European pentru Standardizare (norme) 

- CEN/TC251 - Comitetul Tehnic European pentru Informatica Medicala 

- ANSI - Institutul National American de Standarde 

- ISO - Organizatia Internationala pentru Standarde. 

c) Etapele lansarii unui standard european 

La nivelul CEN, in diferitele comitete tehnice se elaboreaza proiectele de 
standarde care tree prin urmatoarele etape: 

ENV - pre-standard european: forma preliminara anuntata pentru a fi verificata 
pe o perioada de 3 ani la nivele nationale 

EN - standard european: un prestandard acceptat devine norma obligatorie; 
prevederile nationale care nu sunt in concordanta trebuie retrase pentru adaptarea 
deplina a standardului 

CR - “CEN - raporf ’: este prestandard la care nu s-a ajuns la consens, insa are 
prevederi atat de importante incat sunt facute publice; totodata pot deveni CR alte 
documente normative care nu sunt propuse ca standarde 
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HD - “ Harmonization Document ” este un standard adaptat ca §i EN, dar 
permite unele variatii nationale pentru o perioada de tranzitie. 

d) Caracteristicile unui standard 

Enuntarea unui standard trebuie sa indeplineasca anumite conditii, denumite 
precurtat “SMART”: 

. S - specific - obiectul sa fie bine definit, clar, fara ambiguitati 

. M - masurabil - actiunile sa poata fi masurate §i exprimate cantitativ §i 

calitativ 

. A - acceptabil de catre institutiile care il utilizeaza 

. R - realistic - sa cuprinda actiuni ce pot fi intreprinse practic 

. T - “ time-related ” - actiunile trebuiesc precizate in timp ca termene §i durate. 

e) Standardul HL7 

HL7 este o organizatie internationala, infiintata cu mai bine de 20 de ani in 
urma, care dezvolta standarde pentru schimbul de informatii electronice in domeniul 
sanatatii, precum §i de management §i integrare a acestor informatii. HL7 nu dezvolta 
software , ci specificatii (e.g. messaging standard) care sa permita interoperabilitatea - 
aplicatii disparate sa poata schimba cel putin un set minimal de date clinice §i 
administrative. 

Standardul HL7 permite interoperabilitate: 

• tehnica - datele pot fi mutate din sistemul A in sistemul B 

• semantica - asigura ca sistemul A §i sistemul B inteleg datele in acela§i fel 

• de proces - permite ca activitatile organizatiilor care gazduiesc sistemele 
A §i B sa fie compatibile §i sa se desfa§oare impreuna. 
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